Linked open data

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le linked open data (ou LOD) et parfois dénommé données ouvertes et liées (DOL) par les francophones (qui cependant semblent employer plus souvent le terme anglais) est un concept qui associe systématiquement deux modes différents de gestion de la donnée présente sur l'Internet :

  1. la donnée liée (selon les principes du web sémantique édictés par Tim Berners-Lee[1]);
  2. la donnée ouverte.
Représentation en carte heuristique des relations entre les données ouvertes de DBpedia et divers autres projets du Web en 2007
Représentation des relations entre DBpedia et divers autres projets du Web en 2009
Le même réseau que ci-dessus, mais en 2010, chaque couleur présentant un type de domaine (ex : Sciences de la vie en rose)

Enjeux[modifier | modifier le code]

Cette approche est devenue un modèle de structuration normalisée du web des données ouvertes ainsi constitué en réseau plus cohérent et efficient de données (et au-delà de sites internet), qui s'inscrit dans l'Informatique durable (grâce à plus de transparence, et moins de consommation de serveurs, économies d'énergie et de temps... à service rendu égal ou amélioré)[2].

De nombreux auteurs tels que Mihaela Mathieu, Antoine Zimmermann[3], Olivier Boissier, et Philippe Beaune, de l'ENSM-SE, estiment que la puissance des données ouvertes et liées (sémantiquement enrichi[4]) peut beaucoup apporter à la dynamique du développement durable[5] et donner de l'efficience[6] et du sens au Web[7].

Principes techniques[modifier | modifier le code]

Les données sont liées entre elles au travers de combinaisons « donnée-lien-donnée », ou « sujet-prédicat-objet » (Le prédicat est ce qui attribue quelque chose au sujet, et désigne une relation sur un ensemble d’individus prédéfini), cette combinaison forme dans « un graphe RDF » ce qu'on nomme un « Triplet RDF » dans le jargon des gestionnaires de données (RDF signifiant ici Resource Description Framework, le modèle de graphe utilisé pour décrire formellement les ressources Web et leurs métadonnées, afin d'en permettre un traitement automatique de ces descriptions et une certaine interopérabilité).

Histoire[modifier | modifier le code]

Le linked open data est étroitement lié à l'essor du web sémantique. Ce dernier est à la base une idée de l'inventeur même du web, Tim Berners-Lee, qui publie en 2001 un article présentant le concept de web sémantique[8]. L'idée présentée peine à percer et à se concrétiser, sans doute à cause de la complexité technique sous-jacente. En 2006, Berners-Lee publie un second article, intitulé simplement Linked Data[1]. Le concept commence alors à se populariser et gagne en visibilité.

La plus grande partie des données « ouvertes et liées » du Web étaient d'abord concentrées dans le web anglophone, mais avec des données déjà liées au-delà des frontières linguistiques (comme dans Wikipédia grâce aux liens interlangue, aujourd'hui pris en charge par Wikidata),

Puis l'intégration de liens dans d'autres langues (dont le français) ont permis au reste du monde (dont à la francophonie) de commencer à s'approprier ce mode d'exploitation de l'internet. Wikipédia est en outre conçu comme un réseau ouvert et lié interlangue.

Exemple[modifier | modifier le code]

  • DBpedia en un des exemples les plus connus et de grande taille, qui a adopté les normes du réseau linked open data[9] et celles du Web sémantique, faisant qu'elle a rapidement été fortement interconnectée à d'autres dépôts du web de données tels que GeoNames, MusicBrainz, CIA World Factbook, le projet Gutenberg et Eurostat[9]. L'accès aux dépôt de données se fait avec des requêtes sur la base de données via SPARQL. Les informations étant stockées avec Resource Description Framework, on peut aussi récupérer des documents ressource en relation avec un concept directement via une URI, avec les formats CSV ou RDF (notamment via les formats N-Triple, N3, JSON, XML).
  • Clean energy info portal : Pour Denise Recheis (experte autrichienne en gestion des connaissances), le « Clean Energy info portal (www.reegle.info) et le wiki Energy Info (www.openEI.org) sont conçus comme des passerelles vers une « mine d'informations » sur les problématiques d'énergies renouvelables, d'efficacité énergétique et de changement climatique. Ils sont hébergés respectivement par REEEP (Renewabel Energy and Energy Efficiency Partnership) et NREL (National Renewable Energy Laboratory), deux organisations très engagées sur l'idée des données ouvertes et liées et qui en ont intégré les principes essentiels »[10].

Notes et références[modifier | modifier le code]

  1. a et b BERNERS-LEE, Tim. Linked Data. Dans : World Wide Web Consortium [en ligne]. 2010. Disponible à l’adresse : http://www.w3.org/DesignIssues/LinkedData.html
  2. emse-01082423v1 Communication dans un congrès Andrei Ciortea, Olivier Boissier, Antoine Zimmermann, Adina Magda Florea. Open and Interoperable Socio-technical Networks ; SYNASC 2014 : 16th International Symposium on Symbolic and Numeric Algorithms for Scientific Computing, septembre 2014, Timisoara, Romania. <http://synasc.ro/2014/>
  3. emse-01082430v1 Pré-publication, Document de travail Antoine Zimmermann Documents de l'auteur . RDF 1.1: On Semantics of RDF Datasets 2014
  4. Syed Gillani, Gauthier Picard, Frédérique Laforest, Antoine Zimmermann. Towards Efficient Semantically Enriched Complex Event Processing and Pattern Matching OrdRing 2014 (emse-01087640v1à, Communication au 3 rd International Workshop on Ordering and Reasoning, Oct 2014, Trentino, Italy. 8p, Proceedings of the 3rd International Workshop on Ordering and Reasoning. <http://streamreasoning.org/events/ordring2014>
  5. Disambiguation over Linked Data Corpora Journal of Web Semantics, Elsevier, 2012, special issue on Web-scale Semantic Information Processing, Volume 10, pp.Pages 76-110. <10.1016/j.websem.2011.11.002>
  6. emse-01082498v1 Antoine Zimmermann, Nuno Lopes, Axel Polleres, Umberto Straccia. A general framework for representing, reasoning and querying with annotated Semantic Web data Journal of Web Semantics, Elsevier, 2012, Volume 11, pp.Pages 72-95. <10.1016/j.websem.2011.08.006>
  7. Andrei Ciortea, Olivier Boissier, Antoine Zimmermann, Adina Magda Florea. Adding a Social Dimension to the Web of Things ; Journées scientifiques SEmba 2013, Apr 2013, Saint Germain au Mont d'Or, France
  8. BERNERS-LEE, Tim, HENDLER, James et LASSILA, Ora. The semantic web. Scientific American. Mai 2001, p. 29‑37. Disponible à cette adresse: http://www.cs.umd.edu/~golbeck/LBSC690/SemanticWeb.html
  9. a et b Voir notamment cette page du site de DBpedia pour un ensemble d'informations sur les méthodes et les ressources d'inter-relations
  10. Voir http://blog.okfn.org/2012/01/27/linked-open-data-and-low-carbon-development/

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]