Hadoop

Un article de Wikipédia, l'encyclopédie libre.
Aller à : Navigation, rechercher
Hadoop
Le logo de Apache Hadoop
Développeur Apache Software Foundation
Environnements Multiplate-forme, principalement POSIX.
Type Architecture distribuée
Licence Licence Apache
Site web hadoop.apache.org

Hadoop est un framework Java libre destiné aux applications distribuées et à la gestion intensive des données. Il permet aux applications de travailler avec des milliers de nœuds et des pétaoctets de données. Hadoop a été inspiré par les publications MapReduce, GoogleFS et BigTable de Google.

Hadoop a été créé par Doug Cutting et fait, en 2009, partie des projets de la fondation logicielle Apache.

Sommaire

[modifier] Historique

Hadoop faisait auparavant partie du projet Lucene et de Nutch.

[modifier] Architecture

[modifier] Hadoop Distributed File System

Article connexe : Google File System.

Le système de fichiers distribué d'Hadoop fait partie de ses composants de base.

[modifier] MapReduce

Article détaillé : MapReduce.

Hadoop dispose d'une implémentation complète de l'algorithme de MapReduce.

[modifier] HBase

Article détaillé : HBase.

HBase est une base de données distribuée disposant d'un stockage structuré pour les grandes tables.

Comme BigTable, HBase est une base de données orientée colonnes.

[modifier] ZooKeeper

ZooKeeper est un logiciel de gestion de configuration pour systèmes distribués, basé sur le logiciel Chubby développé par Google. ZooKeeper est utilisé entre autres pour l'implémentation de HBase.

[modifier] Hive

Hive est un logiciel d'analyse de données permettant d'utiliser Hadoop avec une syntaxe proche du SQL. Hive a été initialement développé par Facebook.

[modifier] Pig

Pig est un logiciel d'analyse de données comparable à Hive, mais qui utilise le langage Pig Latin. Pig a été initialement développé par Yahoo!.

[modifier] Utilisations

Plusieurs grands noms de l'informatique ont déclaré utiliser Hadoop, comme Facebook, Twitter, Yahoo ou Microsoft[1].

[modifier] Distributions

Une version d'Hadoop est également distribuée par Cloudera, qui propose un service de formation et un support commercial[2].

[modifier] Solutions

La société Hurence propose des solutions d'analyse de données sur Hadoop et HBase, ainsi qu'un service de formation et un support commercial[3].

[modifier] Notes et références

  1. Liste d'entreprises déclarant utiliser Hadoop
  2. Site officiel de Cloudera, présentant son service de formation et de support
  3. Site officiel de Hurence, présentant son offre Big Data Analytics sur Hadoop

[modifier] Liens externes

Outils personnels
Espaces de noms

Variantes
Actions
Navigation
Contribuer
Imprimer / exporter
Boîte à outils
Autres langues