Web des données

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

Le Web des données (linked data, en anglais) est une initiative du W3C (Consortium World Wide Web) visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d'informations.

Il s'appuie sur les standards du Web, tels que HTTP et URI - mais plutôt qu'utiliser ces standards uniquement pour faciliter la navigation par les êtres humains, le Web des données les étend pour partager l'information également entre machines. Cela permet d'interroger automatiquement les données, quels que soient leurs lieux de stockage, et sans avoir à les dupliquer[1].

Tim Berners-Lee, directeur du W3C, a inventé et défini le terme Linked Data ou Données liées[2] et son synonyme Web of data au sein d'un ouvrage portant sur l'avenir du Web sémantique[3]. En France, le terme Web des données est de plus en plus utilisé par la communauté des professionnels du domaine[4].

Pour les bibliothèques, il est nécessaire de participer au web des données afin de gagner en visibilité. Le web des données permet ainsi de décloisonner les données des catalogues, afin qu'elles soient plus accessibles aux usagers et ceux en devenir. Il permet entre autre de relier des données d'archives, de musées ou des biographies à des textes présents dans le catalogue, offrant ainsi au chercheur une information plus complète.[5]

Principes[modifier | modifier le code]

Tim Berners-Lee a défini quatre piliers pour soutenir l'initiative « Web des données » :

  1. utiliser des adresses URI uniques pour identifier les choses ;
  2. utiliser des adresses URI HTTP qui existent sur le Web (des URL, donc). Une Erreur HTTP 404 indique simplement que l’adresse URI utilisée n’est pas documentée explicitement ;
  3. fournir à travers l’adresse URI des renseignements exploitables, lisibles par les humains et par les machines, en s’appuyant sur des formats ouverts comme RDF ou SparQL. P. ex. en utilisant le mécanisme de redirection HTTP (code 302) et la variable User-Agent contenue dans les en-têtes des requêtes HTTP, un serveur peut afficher une page en XML ou RDF pour une machine ou une page HTML pour le navigateur d'une personne ;
  4. mailler l’adresse URI initiale en lui associant des adresses URI externes et ce pour améliorer la découverte d'autres informations sur le Web.

Composants[modifier | modifier le code]

Données Ouvertes Liées[modifier | modifier le code]

Une donnée ouverte liée est une donnée liée en Open data. Tim Berners-Lee donne la plus claire définition des données ouvertes liées pour les différencier avec le web des données.

Une Donnée Ouverte est une Donnée Liée qui est publiée sous une licence ouverte, ce qui n'entrave pas sa réutilisation gratuitement.

- Tim Berners-Lee, Données Liées

Des grands ensembles de données ouvertes liées incluent DBpedia et Wikidata.

Histoire[modifier | modifier le code]

Le terme "donnée ouverte liée" est en application depuis Février 2007, quand la liste de diffusion de la "jonction des données ouvertes" a été créée. La liste de diffusion a été initialement hébergée par le projet SIMILE au Massachusetts Institute of Technology.

Notes et références[modifier | modifier le code]

  1. (en) Bizer, Heath, Berners-Lee, « Linked Data - The Story So Far », (consulté le 14 mai 2011)
  2. OQLF terminologie : Données Liées
  3. (en) Tim Berners-Lee, « Linked Data - Design Issues », W3C, (consulté le 18 décembre 2010)
  4. (en) Bibliothèque nationale de France, « Web sémantique, Web de données », BnF, (consulté le 14 mai 2011)
  5. Bibliothèque nationale de France, « BnF - Web sémantique, web de données : définitions », sur www.bnf.fr (consulté le 30 novembre 2017)

Articles connexes[modifier | modifier le code]

Sur les autres projets Wikimedia :