Catalogue de librairies Python pour l'analyse de données

Ce catalogue a pour but de recenser et présenter de façon succincte les principales librairies liées à l'analyse et au traitement de données en Python. De la sorte, un acteur avec des connaissances de base dans le domaine pourra naviguer le-dit catalogue afin de découvrir et repérer des librairies interéssantes pour son projet et de décider rapidement si oui ou non la librairie concernée mérite une étude plus approfondie, via son site ou sa documentation.

Ce catalogue est un projet opensource développé à l'University de Mons dans le cadre du programme opérationnel FEDER « Wallonie-2020.eu ».
Les contributions à la forme et au contenu sont les bienvenues.

Catégories


Fiches récentes

dtale

D-Tale est la combinaison d’un backend Flask et d’un frontend React pour apporter un moyen facile de visualiser et d’analyser les structures de données de Pandas. Il s’intègre parfaitement aux notebooks ipython/jupyter.

Actuellement, cet outil …

plus ...

graph-tool

graph-tool est un module permettant la manipulation et l’analyse statistique de graphes. Pour ce faire, de nombreuses opérations sont proposées, mais aussi des générateurs, …

Malgré son apparence de module Python, les opérations critiques sont écrites en C++ et utilisant …

plus ...

NetworkX

NetworkX est un module ciblant la création, la manipulation et l’étude des structures, dynamiques et fonctions de graphes complexes. Le public visé est composé de mathématiciens, physiciens, biologistes, informaticiens ou sociologues.

En particulier, NetworkX propose :

  • Des structures de données …
plus ...

Prophet

Prophet est une librairie ciblant les marchés financiers. Son objectif est de proposer une interface simple mais flexible pour permettre au développeur de se concentrer sur la modélisation de stratégies financières, de gestion de portfolio, ou des test rétro-actif.

Pour …

plus ...

Spark

Spark est un système de calcul distribué efficace et généraliste, visant le domaine du Big Data. Le cœur de Spark contient des routines de calcul optimisées pour l’analyse de données, avec des API, ici en Python.

Le principal apport …

plus ...

toolz

toolz est une ensemble de fonctions d’utilité générale pour les itérateurs, les fonctions et les dictionnaires.

Toutes ces nouvelles fonctions sont :

  • Composables (sont interopérables)
  • Sans effet de bord
  • Efficientes : ne calculent que le necéssaire
  • Low Tech : Pas d’artifice …
plus ...