TextBlob est une librairie proposant une API simple permettant d’accéder à des fonctions d’analyse liées au traitement du langage (NLP).

TextBlob repose par-dessus NTLK et pattern, deux librairies communes de NLP, et permet de jongler avec celles-ci dans une API cohérente.

Elle propose la plupart des tâches courantes :

  • Extraction de la phrase nominale
  • Étiquetage des rôles grammaticaux
  • Analyse des sentiments
  • Classification (Bayésien Naïf, Arbre de décision)
  • Traduction et détection de traduction via Google Translate
  • Division du texte en phrases et mots
  • Fréquence de mots et de phrases
  • n-grams
  • Conjugaison, mise au singulier et pluriel, lemmatisation
  • Correction orthographique
  • Extensions ajoutant des modèles ou langues supplémentaires
  • Intégration de WordNet