Linked open data

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le Linked Open Data ou «données ouvertes liées» consiste à rendre libre de toute license des bases de données préalablement liées entre elles selon le modèle du Linked Data de Tim Berners-Lee. Ce système rend la recherche sur le web plus efficace et dynamique pour l'utilisateur en reliant d'autres sources d'infromations pertinentes et isoupçonnées à la recherche initale. Le fait que les données soient libres permet leur accès et leur réutilisation sans aucune restriction.

Le Linked Open Data s'inscrit dans le web 3.0 qui est un web de données. À la différence du Web 1.0 qui regroupe quantité de documents individuels sous la forme de silos de données isolés des uns des autres, le web 3.0 est constitué de données brutes respectant toutes les mêmes standards du Web, ce qui rend leur utilisation, leur partage et leur interopérabilité très facile. Le Web des données prend forme à travers un modèle proposé par le W3C, le Web sémantique qui est un modèle commun permettant le partage et la réutilisation de données sont surtout présent par l’entremise d’une application, d’une compagnie ou d’une communauté[1]. Ainsi, le Web des données offre une immense quantité de données disponibles sur le Web dans un format standard afin que cette masse d'informations puisse être traitée par des outils du web sémantique. L'accessibilité doit être garantie autant aux données qu'aux liens entre celles-ci afin de créer une vaste toile d'information et de connaissances[2].

Représentation en carte heuristique des relations entre les données ouvertes de DBpedia et divers autres projets du Web en 2007
Représentation des relations entre DBpedia et divers autres projets du Web en 2009
Le même réseau que ci-dessus, mais en 2010, chaque couleur présentant un type de domaine (ex : Sciences de la vie en rose)

Enjeux[modifier | modifier le code]

Cette approche est devenue un modèle de structuration normalisée du web des données ouvertes ainsi constitué en réseau plus cohérent et efficient de données (et au-delà de sites internet), qui s'inscrit dans l'Informatique durable (grâce à plus de transparence, et moins de consommation de serveurs, économies d'énergie et de temps... à service rendu égal ou amélioré)[3].

De nombreux auteurs tels que Mihaela Mathieu, Antoine Zimmermann[4], Olivier Boissier, et Philippe Beaune, de l'ENSM-SE, estiment que la puissance des données ouvertes et liées (sémantiquement enrichi[5]) peut beaucoup apporter à la dynamique du développement durable[6] et donner de l'efficience[7] et du sens au Web[8].

Principes techniques[modifier | modifier le code]

Le Linked Open Data repose sur 4 principes de base essentiels[9]

  1. Les données doivent être libres de toute licence pour que des liens soient facilement faits entres elles.
  2. Chaque lien utilise le modèle Ressource Description Framework (RDF). Un RDF triplet est une association triple de liens soi: sujet-prédicat-objet. Ce modèle permet de décrire formellement les ressources Web et leurs métadonnées, afin d'en permettre un traitement automatique et une certaine interopérabilité)
  3. Afin d'être localisée, chaque ressource possède une adresse unique et permanente en ligne, Uniform Ressource Identifier (URI).
  4. Les données doivent être mise en ligne suivant le protocole standard HTTP.

.

Histoire[modifier | modifier le code]

Le linked open data est étroitement lié à l'essor du web sémantique. Ce dernier est à la base une idée de l'inventeur même du web, Tim Berners-Lee, qui publie en 2001 un article présentant le concept de web sémantique[10]. L'idée présentée peine à percer et à se concrétiser, sans doute à cause de la complexité technique sous-jacente. En 2006, Berners-Lee publie un second article, intitulé simplement Linked Data. Le concept commence alors à se populariser et gagne en visibilité.

La plus grande partie des données « ouvertes et liées » du Web étaient d'abord concentrées dans le web anglophone, mais avec des données déjà liées au-delà des frontières linguistiques (comme dans Wikipédia grâce aux liens interlangue, aujourd'hui pris en charge par Wikidata),

Puis l'intégration de liens dans d'autres langues (dont le français) ont permis au reste du monde (dont à la francophonie) de commencer à s'approprier ce mode d'exploitation de l'internet. Wikipédia est en outre conçu comme un réseau ouvert et lié interlangue.

Exemple[modifier | modifier le code]

  • DBpedia en un des exemples les plus connus et de grande taille, qui a adopté les normes du réseau linked open data[11] et celles du Web sémantique, faisant qu'elle a rapidement été fortement interconnectée à d'autres dépôts du web de données tels que GeoNames, MusicBrainz, CIA World Factbook, le projet Gutenberg et Eurostat[11]. L'accès aux dépôt de données se fait avec des requêtes sur la base de données via SPARQL. Les informations étant stockées avec Resource Description Framework, on peut aussi récupérer des documents ressource en relation avec un concept directement via une URI, avec les formats CSV ou RDF (notamment via les formats N-Triple, N3, JSON, XML).
  • Clean energy info portal : Pour Denise Recheis (experte autrichienne en gestion des connaissances), le « Clean Energy info portal (www.reegle.info) et le wiki Energy Info (www.openEI.org) sont conçus comme des passerelles vers une « mine d'informations » sur les problématiques d'énergies renouvelables, d'efficacité énergétique et de changement climatique. Ils sont hébergés respectivement par REEEP (Renewabel Energy and Energy Efficiency Partnership) et NREL (National Renewable Energy Laboratory), deux organisations très engagées sur l'idée des données ouvertes et liées et qui en ont intégré les principes essentiels »[12].

Initiative canadienne[modifier | modifier le code]

Le gouvernement du Canada a lancé en 2016 un projet de Linked Open Data afin d'offrir un moyen plus excitant et accessible pour découvrir le patrimoine canadien. Le Réseau canadien d'information sur le patrimoine CHIN[13] reprend le fonctionnement des données ouvertes liées dans le but d'augmenter la visibilité des collections de différents musées dont l'inventaire a été réalisé par Artefac Canada. Huit musées ont participé à cette initiative: The Art Gallery of Greater Victoria, The Art Gallery of Nova Scotia, The Art Gallery of Ontario, le Musée McCord, The McMichael Canadian Art Collection, le Musée des beaux-arts de Montréal, le Musée des beaux-arts du Canada et The Vancouver Art Gallery. Le CHIN permet ainsi aux utilisateurs de référencer les métadonnées sur un artiste, un groupe d'artiste ou une œuvre d'art avec des liens vers Artefac Canada ou alors d'utiliser ces mêmes métadonnées pour référencer du contenu Web propre à l'utilisateur.

Notes et références[modifier | modifier le code]

  1. https://www.w3.org/2001/sw/
  2. https://www.w3.org/standards/semanticweb/data
  3. emse-01082423v1 Communication dans un congrès Andrei Ciortea, Olivier Boissier, Antoine Zimmermann, Adina Magda Florea. Open and Interoperable Socio-technical Networks ; SYNASC 2014 : 16th International Symposium on Symbolic and Numeric Algorithms for Scientific Computing, septembre 2014, Timisoara, Romania. <http://synasc.ro/2014/>
  4. emse-01082430v1 Pré-publication, Document de travail Antoine Zimmermann Documents de l'auteur . RDF 1.1: On Semantics of RDF Datasets 2014
  5. Syed Gillani, Gauthier Picard, Frédérique Laforest, Antoine Zimmermann. Towards Efficient Semantically Enriched Complex Event Processing and Pattern Matching OrdRing 2014 (emse-01087640v1à, Communication au 3 rd International Workshop on Ordering and Reasoning, Oct 2014, Trentino, Italy. 8p, Proceedings of the 3rd International Workshop on Ordering and Reasoning. <http://streamreasoning.org/events/ordring2014>
  6. Disambiguation over Linked Data Corpora Journal of Web Semantics, Elsevier, 2012, special issue on Web-scale Semantic Information Processing, Volume 10, pp.Pages 76-110. <10.1016/j.websem.2011.11.002>
  7. emse-01082498v1 Antoine Zimmermann, Nuno Lopes, Axel Polleres, Umberto Straccia. A general framework for representing, reasoning and querying with annotated Semantic Web data Journal of Web Semantics, Elsevier, 2012, Volume 11, pp.Pages 72-95. <10.1016/j.websem.2011.08.006>
  8. Andrei Ciortea, Olivier Boissier, Antoine Zimmermann, Adina Magda Florea. Adding a Social Dimension to the Web of Things ; Journées scientifiques SEmba 2013, Apr 2013, Saint Germain au Mont d'Or, France
  9. https://vimeo.com/36752317
  10. BERNERS-LEE, Tim, HENDLER, James et LASSILA, Ora. The semantic web. Scientific American. Mai 2001, p. 29‑37. Disponible à cette adresse: http://www.cs.umd.edu/~golbeck/LBSC690/SemanticWeb.html
  11. a et b Voir notamment cette page du site de DBpedia pour un ensemble d'informations sur les méthodes et les ressources d'inter-relations
  12. Voir http://blog.okfn.org/2012/01/27/linked-open-data-and-low-carbon-development/
  13. http://chin-rcip.canadiana.ca/aclod/about?lang=fr

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]