dtale

D-Tale est la combinaison d’un backend Flask et d’un frontend React pour apporter un moyen facile de visualiser et d’analyser les structures de données de Pandas. Il s’intègre parfaitement aux notebooks ipython/jupyter.

Actuellement, cet outil …

plus ...

graph-tool

graph-tool est un module permettant la manipulation et l’analyse statistique de graphes. Pour ce faire, de nombreuses opérations sont proposées, mais aussi des générateurs, …

Malgré son apparence de module Python, les opérations critiques sont écrites en C++ et utilisant …

plus ...

Lifelines

Lifelines est une implémentation d’analyse de survie : quelle est la probabilité qu’un évènement mettant fin aux interactions (“mort”) se produise, en fonction du temps ? Et quelle sera notre population après un temps donné ?

Ses spécificités sont :

  • De s …
plus ...

Lifetimes

Lifetimes est une librairie permettant d’évaluer et de prédire la valeur totale d’un client, jusqu’à sa dernière interaction.

Cela se fait sous deux hypothèses :

  • Un utilisateur qui interagi est “vivant”
  • Un utilisateur peut “périr” après un certain …
plus ...

NetworkX

NetworkX est un module ciblant la création, la manipulation et l’étude des structures, dynamiques et fonctions de graphes complexes. Le public visé est composé de mathématiciens, physiciens, biologistes, informaticiens ou sociologues.

En particulier, NetworkX propose :

  • Des structures de données …
plus ...

Pandas Profiling

Pandas profiling permet de produire un rapport HTML interactif à partir d’un DataFrame produit par pandas. Pandas propose df.describe(); cette librairie ajoute df.profile_report() pour une analyse rapide. Des exemples sont proposé dans la documentation, tel que https …

plus ...

Patsy

Patsy est une librairie permettant la description de modèles statistiques (comportant un facteur linéaire) et permettant de construire des matrices de design. Celles-ci peuvent définir une régression ou une appartenance à des groupes.

La syntaxe utilisée est inspirée et compatible …

plus ...

Prophet

Prophet est une librairie ciblant les marchés financiers. Son objectif est de proposer une interface simple mais flexible pour permettre au développeur de se concentrer sur la modélisation de stratégies financières, de gestion de portfolio, ou des test rétro-actif.

Pour …

plus ...

Scipy

SciPy, la librairie, est un ensemble de modules mathématiques et scientifiques. En particulier, il y a des modules ayant pour sujet :

  • Les statistiques
  • L’optimisation
  • L’intégration
  • L’algèbre linéaire
  • Les transformées de Fourier
  • Le traitement du signal
  • La résolution …
plus ...

seaborn

Seaborn est un outil de visualisation statistique, construit par-dessus matplotlib et pensé pour l’utilisation avec pandas.

Alt Text

Seaborn propose principalement des représentations relationnelles, par catégorie, des distributions, régressions, et représentations multiples (sur des sous-ensembles des données). Le tout propose des …

plus ...

Spark

Spark est un système de calcul distribué efficace et généraliste, visant le domaine du Big Data. Le cœur de Spark contient des routines de calcul optimisées pour l’analyse de données, avec des API, ici en Python.

Le principal apport …

plus ...

statsmodels

statsmodels est un module Python visant à complèter SciPy, en terme de statistique descriptive, d’économétrie, d’estimation ou d’inférence (se basant à chaque fois sur un modèle pertinent).

import numpy as np
import statsmodels.api as sm

# Génération …
plus ...