Informatique décisionnelle open source

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'Informatique décisionnelle open source (open source business intelligence, OSBI) regroupe l'ensemble des solutions et techniques liées au décisionnel et dont le modèle s'appuie sur l'open source.

La quasi-totalité des domaines de l'informatique décisionnelle du monde propriétaire sont aussi couverts par l'OSBI.

L'OSBI, dont les codes logiciels sont en partie publics, n'a rien à voir avec l'open source intelligence (OSINT) qui désigne la recherche dans les sources publiques, c'est-à-dire les journaux, annuaires…

Bases de données[modifier | modifier le code]

Le monde du logiciel libre propose des alternatives face aux systèmes de bases de données propriétaires Oracle ou Microsoft SQL Server. Les solutions les plus réputées sont :

ETL[modifier | modifier le code]

Les ETL (extract-transform-load) sont les outils pour manipuler les données, comme pour la construction et l'alimentation des datawarehouse (entrepôts de données).

Les ETL open source permettent d'effectuer un grand nombre de traitements pour l'extraction (« E »), la transformation (« T ») et le chargement (loading, « L ») de données, ceci depuis ou vers un grand nombre de systèmes :

  • extraction et chargement de données en provenance de nombreux SGBD via les drivers JDBC : Oracle, PostgreSQL, MySql, MS SqlServer, IBM DB2, Sybase, Teradata
  • extraction et alimentation de fichiers plats : CSV, Excel, XML, fichier dont la longueur d'un enregistrement est fixe…
  • transtypage, ajouts de champs calculés et de constantes, mapping, normalisation et dénormalisation
  • Dédoublonnage de lignes, contrôles et routages de flux
  • validation et nettoyage de données
  • fonction de recherche (lookup) d'informations additionnelles permettant par exemple la jointure entre deux SGBD différents
  • extraction et chargement dans des progiciels spécifiques (SAP, SugarCRM…) ou des annuaires LDAP
  • fonctions décisionnelles : Slowly Changing Dimension, lecture de cubes OLAP (Mondrian (en), Palo (Palo)), agrégations
  • fonctionnalités orientées EAI : récupération et envoi de fichiers par FTP, SSH, Mail, Scripting, messages orientés services, Web Services

Il existe plusieurs ETL open source, avec des versions de base entièrement libres (gratuites) et des versions professionnelles (payantes). Ces dernières sont dotées de fonctionnalités avancées et permettant d'obtenir un support direct auprès de l'éditeur.

Les ETL open source les plus complets et reconnus sont les suivants :

  • Talend Open Studio : Talend Open Studio (TOS) est édité par la société Talend. Talend est un ETL dont l'interface graphique s'appuie sur Eclipse RCP et est de type « générateur de code » : un code spécifique est généré (et visible) pour chaque traitement d'intégration de données. Talend Integration Suite (TIS) désigne la version professionnelle, dont l'essentiel des fonctionnalités supplémentaires a pour but de fournir des fonctionnalités avancées d'entreprise : développement collaboratif, gestion des déploiements, console d'administration et de planification des jobs en production [1].
  • Pentaho (Pentaho) Data Integration (PDI) également connu sous le nom de « Kettle » : PDI est un ETL qui présente à peu de chose près les mêmes fonctionnalités que Talend, la différence principale étant son interface basée sur Java SWT et son mécanisme de « méta moteur » [2]. PDI embarque en effet la totalité du code nécessaire dans son noyau et ne traite ainsi que les flux de données. Ainsi, un traitement Kettle peut être stocké sous forme de fichier plat (XML) ou bien dans un SGBD (« Kettle repository »), ce dernier servant également de référentiel de travail partagé. Un des attraits de PDI est son niveau d'intégration avec la plate-forme OSBI Pentaho : Kettle peut ainsi servir de source de données au moteur de reporting de Pentaho et même permettre l'élaboration de vues d'analyses multidimensionnelles avec le concept « Agile BI » et l'outil Pentaho Analyzer
En mars 2016, la dernière version de Pentaho est la 6.0[3]
  • CloverETL (en) : CloverETL est édité par la société Javlin (en février 2016, la dernière version est 4.1.2)

Outils de reporting[modifier | modifier le code]

  • Jasper (iReport)
  • Eclipse Birt (Actuate)
  • JFreeReport / JFreeChart

Outils d'analyse multidimensionnelle[modifier | modifier le code]

SGBD relationnels d'analyse[modifier | modifier le code]

Plates-formes OSBI WEB[modifier | modifier le code]

Moteurs d'analyses statistiques[modifier | modifier le code]

Exploration de données et fouille de textes[modifier | modifier le code]

ERP[modifier | modifier le code]

Odoo

CRM[modifier | modifier le code]

SugarCRM

Notes et références[modifier | modifier le code]

  1. Description de Talend [1] .
  2. Description de Pentaho Data Integration [2] .
  3. (en) La version 6.0 de Pentaho.
  4. Description de Jasper [3]
  5. http://eric.univ-lyon2.fr/~ricco/sipina.html

Liens externes[modifier | modifier le code]

  • osbi.fr - blog sur les solutions décisionnelles open source