Orange est un système de datamining composé de différents sous-modules. Sont inclus :
- la visualisation de données
- l’exploration
- le pré-traitement
- des techniques de génération de modèle
- Une interface graphique et une API intuitives
Le module Python est disponible séparément de l’interface graphique. Celle-ci reste pertinente pour créer une pipeline facilement, y manipuler les données, y adapter un modèle et la valider.
La visualisation et l’exploration sont facilitées par des méthodes intelligentes. Des distributions de probabilités, arbres de décision, clusters hiérarchiques, heatmaps, et aussi des représentation de données multidimensionnelles sont proposées. Toutes sont interactives.
La partie programmation graphique permet principalement de rendre l’exploration et le prototypage plus rapides. Elle peut être utilisées dans l’apprentissage. Orange met en avant son utilisation par des écoles, universités et formations professionnelles.
De plus, des add-ons existent pour Orange, pour pouvoir étendre les sources de données, faire du Natural Language Processing (NLP), de la bioinformatique,…
Le projet est porté par l’université de Ljubljana.