Extract Transform Load

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir ETL.

Extract-Transform-Load est connu sous le terme ETL, ou extracto-chargeur, (ou parfois : datapumping). Il s'agit d'une technologie informatique intergicielle (comprendre middleware) permettant d'effectuer des synchronisations massives d'information d'une source de données (le plus souvent une base de données) vers une autre. Selon le contexte, on est amené à exploiter différentes fonctions, souvent combinées entre elles : « extraction », « transformation », « constitution » ou « conversion », « alimentation ».

Elle repose sur des connecteurs servant à exporter ou importer les données dans les applications (ex. : connecteur Oracle ou SAP…), des transformateurs qui manipulent les données (agrégations, filtres, conversions…), et des mises en correspondance (mappages). L'objectif est l'intégration ou la réexploitation de données d'un réservoir source dans un réservoir cible.

À l'origine, les solutions d'ETL sont apparues pour le chargement régulier de données agrégées dans les entrepôts de données (ou datawarehouse), avant de se diversifier vers les autres domaines logiciels. Ces solutions sont largement utilisées dans le monde bancaire et financier, ainsi que dans l'industrie, au vu de la multiplication des nombreuses interfaces.

Des technologies complémentaires sont apparues par la suite : l'Intégration d'applications d'entreprise (EAI), puis l'ESB (Enterprise Service Bus).

Comparaison générale ETL/EAI [1]
ETL EAI
Mode principal Batch Fil de l'eau (pseudo temps-réel)
Orientation Données Métier
Volumétrie potentiellement forte (ex 15 000 000 de lignes) relativement faible (ex. 100 000 lignes)
Sources / Cibles SGBD, ←ODS, ↔Datawarehouse, →Datamart, ←Progiciel de gestion intégré, ←Gestion de la relation client ↔inter-application au sens large


Il existe également des solutions d'ETL de contenu permettant de manipuler des données non structurées ou faiblement structurées, tels que les dossiers ou les documents. Ces solutions sont utilisées pour des projets de migration de documents. Par exemple, lors de migration de documents d'une application GED vers une autre. Leur champ d'application peut également s'étendre à des projets d'archivage électronique.

Ces outils d'ETL sont également exploitables pour la manipulation de données non ou faiblement structurées dans le cadre de la fouille de textes.

Les Outils d'ETL[modifier | modifier le code]

Propriétaire[modifier | modifier le code]

Open-source[modifier | modifier le code]

Freeware[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Mémoire Réalisation d’un projet de merchandising, 06/12/2007, Laurent DONGE , ingénieur CNAM
  2. Site officiel d'Anatella
  3. Site de IBM InfoSphere DataStage
  4. Site de Informatica PowerCenter
  5. Fiche produit Talend
  6. Benetl