Portail:Données

Une page de Wikipédia, l'encyclopédie libre.
correlogramme Portail de la Datascience et de la donnée
Data science.png

Ce portail vise à rassembler les articles autour de la donnée, de la datascience, des technologies Big data et de la DataViz (Data visualisation)

155 articles sont actuellement liés au portail


Outils informatique

HadoopTableau Software

Autour de Hadoop : Apache DrillApache FlumeApache HiveApache KafkaApache OozieApache PigApache SparkApache SqoopApache ZeppelinApache ZooKeeperClouderaHortonworksMapRHBaseImpala (Cloudera)MapReducePresto (moteur de requête SQL)Hadoop YARNElasticsearchSolrHue (Hadoop)Apache AtlasApache Sentry

Langages : R (langage de programmation et environnement statistique) (Ggplot2) • Scala (langage)Python (langage) (Scikit-learn) • Julia (langage de programmation)SQL

Divers : VagrantApache MahoutKubeflow

Jeux de données : Iris (jeu de données)

Logiciels : Tanagra RStudioSASSPSSOrangeH2O.ai

Bases de données : MongoDBCassandraCouchDBHBase

Formats de données : JSONXMLCSVTabulation-separated valuesPredictive Model Markup LanguageYAML

Formats de données Big data : Apache AvroApache ParquetProtocol Buffers

Concepts : Data lakeDatamartDatawarehouseODSArchitecture LambdaData Lineage

ETL & traitement de la données  : TalendOracle Data IntegratorESBEAI

DataViz

Type de représentation : DendrogrammeNuage de mots-clésNuage de pointsCorrélogramme

Logiciels : Business ObjectsTableau SoftwareQlik

Articles connexes : Carte heuristique

Ailleurs que sur Wikipédia

Autres projets:

Wikibook : Programmation statistiques avec R Découvrir ScilabApprendre à programmer avec Python

Wikiquote : Big data

Wiktionnaire : Big dataDatamining


Littérature Auteurs : Stéphane Tufféry

Internet : wikistat.frhttp://www.jybaudot.fr/General/indexstats.htmlhttp://factominer.free.fr/classical-methods/index_fr.html