Lac de données

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

Un lac de données (en anglais data lake) est une méthode de stockage des données utilisée par le big data[1] (mégadonnées en français). Ces données sont gardées dans leurs formats originaux ou sont très peu transformées.[2] Le principe est d'avoir dans un lieu des données de natures différentes: fichiers ou blobs.

Hadoop et Amazon Web Services S3 sont des plateformes utilisées pour les mettre en place[réf. nécessaire].

Références[modifier | modifier le code]

  1. Alain Clapaud, « Qu’est-ce que le Data Lake, le nouveau concept "Big Data" en vogue », sur Le Journal du Net, (consulté le 22 juin 2016)
  2. (en) « Top Five Differences between Data Lakes and Data Warehouses », sur Blue-Granite.com, (consulté le 15 septembre 2017)

Articles connexes[modifier | modifier le code]