Apache Parquet

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Page d'aide sur l'homonymie Pour les articles homonymes, voir Parquet.
Apache Parquet

Informations
Développé par Apache Software FoundationVoir et modifier les données sur Wikidata
Type Format de fichier (en)
Format de sérialisation de données (d)
Apache Foundation Project (d)Voir et modifier les données sur Wikidata
Licence Apache-2.0Voir et modifier les données sur Wikidata
Site web parquet.apache.orgVoir et modifier les données sur Wikidata

Apache Parquet est un format orienté colonne pour l'écosysteme Apache Hadoop. Il est similaire aux autres formats de fichiers de stockage colonnaires disponibles dans Hadoop, à savoir RCFile et Optimized RCFile. Il est compatible avec la plupart des frameworks de traitement de données de l'environnement Hadoop. Il fournit des schémas efficaces de compression et d'encodage de données avec des performances améliorées pour gérer des données complexes en masse. Le projet open source qui a abouti à Apache Parquet vient des efforts conjoints entre Twitter[1] et Cloudera[2]. La première version de Apache Parquet 1.0 sort en juillet 2013. Depuis le 27 avril 2015 Apache Parquet devient un projet top-level de la Apache Software Foundation [3],[4]


Articles connexes[modifier | modifier le code]

Notes et références[modifier | modifier le code]