scikit-learn est un module Python de machine learning reposant sur SciPy, NumPy et matplotlib (pour le rendu).

scikit-learn propose des outils puissant pour l’analyse et la prédiction de données.

Parmi les outils proposés :

  • Des méthodes de classification
  • Des outils de régression
  • Du clustering
  • Des méthodes de factorisation de matrices (permettant notamment l’analyse en composantes principales)
  • Des outils de comparaison et de choix de modèle (métriques, scores, persistance, courbes d’apprentissages,…)
  • Un prétraitement des données (normalisation, changement de variance, échelonnage, transformation en Gaussienne, discrétisation, effaçage des valeurs manquantes).

Le tout en fait un ensemble accessible et robuste.

scikit-learn est supporté par, entre autres, Fujitsu, intel, nvidia, inria, Microsoft.