scikit-learn est un module Python de machine learning reposant sur SciPy, NumPy et matplotlib (pour le rendu).
scikit-learn propose des outils puissant pour l’analyse et la prédiction de données.
Parmi les outils proposés :
- Des méthodes de classification
- Des outils de régression
- Du clustering
- Des méthodes de factorisation de matrices (permettant notamment l’analyse en composantes principales)
- Des outils de comparaison et de choix de modèle (métriques, scores, persistance, courbes d’apprentissages,…)
- Un prétraitement des données (normalisation, changement de variance, échelonnage, transformation en Gaussienne, discrétisation, effaçage des valeurs manquantes).
Le tout en fait un ensemble accessible et robuste.
scikit-learn est supporté par, entre autres, Fujitsu, intel, nvidia, inria, Microsoft.