Apache Storm

Informations
Développé par	Apache Software Foundation
Première version	12 avril 2014
Dernière version	2.3.0 (27 septembre 2021)
Dépôt	git-wip-us.apache.org/repos/asf/storm.git
Écrit en	Clojure et Java
Type	Calcul distribué; Big data
Licence	Licence Apache
Site web	storm.apache.org

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Apache Storm est un framework de calcul de traitement de flux distribué, écrit principalement dans le langage de programmation Clojure. Créé à l'origine par Nathan Marz ^[3] et l'équipe de BackType ^[4] le projet est rendu open source après avoir été acquis par Twitter^[5]. Il utilise des "spouts" et des "bolts" créés sur mesure pour définir les sources d'informations et les manipulations permettant un traitement par lots et distribué des données en continu. La première publication a eu lieu le 17 septembre 2011^[6].

Une application Storm est conçue comme une "topologie" sous la forme d'un graphe orienté acyclique (DAG) avec des spouts et des bolts faisant office de sommets du graphe. Les arêtes du graphe sont des flux nommés et dirigent les données d'un nœud à un autre. Ensemble, la topologie agit comme un pipeline de transformation de données. À un niveau superficiel, la structure topologique générale est similaire à un travail MapReduce , la principale différence étant que les données sont traitées en temps réel par opposition à des lots individuels. De plus, les topologies Storm s'exécutent indéfiniment jusqu'à ce qu'elles soient supprimées, tandis qu'un DAG de travail MapReduce doit finir^[7].

Storm est devenu un projet de niveau supérieur Apache en septembre 2014 ^[8] et était auparavant en incubation depuis septembre 2013^[9]^,^[10].

Plateformes homologues[modifier | modifier le code]

Storm n'est que l'un des dizaines de moteurs de traitement de flux. Pour une liste plus complète, voir Traitement de flux. Twitter a annoncé Heron le 2 juin 2015 ^[11] API compatible avec Storm. Il existe d'autres moteurs de données en continu comparables, tels que Spark Streaming et Flink^[12].

Voir également[modifier | modifier le code]

Références[modifier | modifier le code]

↑ « https://projects.apache.org/json/projects/storm.json » (consulté le 8 avril 2020)
↑ « Apache Storm 2.3.0 Released », 27 septembre 2021 (consulté le 14 décembre 2021)
↑ Marz, « About Nathan Marz », Nathan Marz (consulté le 28 mars 2013)
↑ « BackType Website (defunct) », BackType (consulté le 28 mars 2013)
↑ « A Storm is coming: more details and plans for release », Engineering Blog, Twitter Inc (consulté le 29 juillet 2015)
↑ « Storm Codebase », Github (consulté le 8 février 2013)
↑ « Tutorial - Components of a Storm cluster », Documentation, Apache Storm (consulté le 29 juillet 2015)
↑ « Apache Storm Graduates to a Top-Level Project »
↑ « Storm Project Incubation Status », Apache Software Foundation (consulté le 29 octobre 2013)
↑ « Storm Proposal », Apache Software Foundation (consulté le 29 octobre 2013)
↑ « Flying faster with Twitter Heron », Engineering Blog, Twitter Inc (consulté le 3 juin 2015)
↑ « Benchmarking Streaming Computation Engines: Storm, Flink and Spark Streaming » [PDF], IEEE, mai 2016

[wikidata-e5ec259581aad77a38a727653968d6ea860c59f7-1] « https://projects.apache.org/json/projects/storm.json » (consulté le 8 avril 2020)

[wikidata-625bedb22fe928675e481959828d42f7efc92388-2] « Apache Storm 2.3.0 Released », 27 septembre 2021 (consulté le 14 décembre 2021)

[3] Marz, « About Nathan Marz », Nathan Marz (consulté le 28 mars 2013)

[4] « BackType Website (defunct) », BackType (consulté le 28 mars 2013)

[5] « A Storm is coming: more details and plans for release », Engineering Blog, Twitter Inc (consulté le 29 juillet 2015)

[6] « Storm Codebase », Github (consulté le 8 février 2013)

[7] « Tutorial - Components of a Storm cluster », Documentation, Apache Storm (consulté le 29 juillet 2015)

[8] « Apache Storm Graduates to a Top-Level Project »

[9] « Storm Project Incubation Status », Apache Software Foundation (consulté le 29 octobre 2013)

[10] « Storm Proposal », Apache Software Foundation (consulté le 29 octobre 2013)

[11] « Flying faster with Twitter Heron », Engineering Blog, Twitter Inc (consulté le 3 juin 2015)

[12] « Benchmarking Streaming Computation Engines: Storm, Flink and Spark Streaming » [PDF], IEEE, mai 2016

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

v · m Écosystème Hadoop
Distributions Hadoop	Cloudera Hortonworks MapR
Base de données	HBase
Flux de données	Apache Sqoop Apache Flume Apache Kafka Apache Storm Apache Flink
Interrogation	Apache Hive Spark SQL Pig
Machine Learning	Apache Mahout Apache Spark ML
SQL	Presto Apache Hive Apache Impala Apache Drill
Gestionnaire de cluster	Hadoop YARN Apache Mesos Apache Spark
Format de fichier	RCFile Apache Avro Apache Parquet Apache ORC
Vrac	Presto Impala Kudu Pig Apache ZooKeeper

v · m Science des données
Concepts	MapReduce Apprentissage profond Extreme learning machine Apprentissage automatique Apprentissage supervisé Apprentissage non supervisé Réseau de neurones artificiels Représentation graphique de données Exploration de données Textemining Segmentation Intelligence artificielle Big data Data Lineage
Architecture	Hadoop Cloudera Hortonworks Apache Hive NoSQL NewSQL HBase Cassandra Apache Spark
Outils	Presto Apache Impala Pig Tableau Software Elasticsearch MongoDB Apache Mahout Scikit-learn TensorFlow Theano (logiciel) SPSS JMP Dataiku Apache MXNet ONNX Apache SINGA Keras
Programmation	R Ggplot2 SAS Python Julia SQL Scala
Statistique	ACP AFC ACM Méthode des moindres carrés Analyse des données Homoscédasticité Knn Cartes de Kohonen Statistique multivariée Théorème de Bayes Analyse de la variance Test du χ² Distance de Cook
Articles liés	Watson Teradata Glossaire de l'exploration de données Extract-transform-load Traitement analytique en ligne