Portail:Données/Outils informatiques
Autour de Hadoop : Apache Drill • Apache Flume • Apache Hive • Apache Kafka • Apache Oozie • Apache Pig • Apache Spark • Apache Sqoop • Apache Zeppelin • Apache ZooKeeper • Cloudera • Hortonworks • MapR • HBase • Impala (Cloudera) • MapReduce • Presto (moteur de requête SQL) • Hadoop YARN • Elasticsearch • Solr• Hue (Hadoop)• Apache Atlas • Apache Sentry •
Langages : R (langage de programmation et environnement statistique) (Ggplot2) • Scala (langage) • Python (langage) (Scikit-learn) • Julia (langage de programmation) • SQL
Divers : Vagrant • Apache Mahout • Kubeflow • GraphQL • Apache NiFi
Jeux de données : Iris (jeu de données) • Demande de valeurs foncières
Logiciels : Tanagra • RStudio • SAS • SPSS • Orange • H2O.ai
Bases de données : MongoDB • Cassandra • CouchDB • HBase
Formats de données : JSON • XML • CSV • Tabulation-separated values • Predictive Model Markup Language • YAML
Formats de données Big data : Apache Avro • Apache Parquet • Protocol Buffers
Concepts : Data lake • Datamart • Datawarehouse • ODS • Architecture Lambda • Data Lineage
ETL & traitement de la données : Talend • Oracle Data Integrator • ESB • EAI • Apache Airflow