Identifiant pérenne

Un article de Wikipédia, l'encyclopédie libre.

Un identifiant pérenne est une chaîne de caractères alphanumériques qui désigne une ressource indépendamment de son emplacement. Cette ressource peut être tout objet réel ou conceptuel[1]. L’identifiant pérenne a généralement vocation à donner accès à cette ressource ou à un substitut acceptable de celle-ci à travers le Web.

Les causes[modifier | modifier le code]

Les systèmes d’identifiants pérennes naissent à la fin des années 1990 à l’initiative de fournisseurs souhaitant identifier et donner accès à des ressources scientifiques et culturelles diffusées en ligne. Dans une logique de reproductibilité, il était nécessaire que ces ressources puissent être citées sans équivoque ; en outre, il était souhaitable que l’identifiant soit actionnable par machine, c’est-à-dire que les systèmes informatiques, et en particulier les navigateurs web, puissent comprendre et donner accès aux ressources identifiées.

On constate alors que les Uniform Resource Locator (URL) utilisées dans ce but ont une espérance de vie plutôt brève[2] : réorganisation des serveurs, changements de systèmes de diffusion ou de nom de l’organisation, etc. entraînent l’obsolescence des URL, conduisant l’utilisateur à une erreur 404.

Tim Berners-Lee considère qu’une conception solide d’URI suffit à assurer la permanence de l'identifiant d'une ressource, tout en recommandant les principes d’opacité[3] communs à la plupart des standards d’identification pérenne[4].

Les principes de l’identification pérenne[modifier | modifier le code]

La solution de l’identification dite « pérenne » repose sur la distinction entre un identifiant conçu pour durer, donc libéré des contingences techniques et administratives, et une URL d’accès destinée à changer au cours du temps. Cette solution implique l’utilisation d’un outil d’attribution maintenant un registre d’association entre identifiant et URL d’accès, et d’un résolveur redirigeant l’utilisateur vers la localisation actuelle de la ressource.

Les services de gestion d’identifiant prennent souvent la forme d'organisations qui proposent des contrats payants, comme la DOI Foundation et ses agences d’attribution pour le Digital Object Identifier (DOI). Le fournisseur de ressources peut implémenter un service d’identifiant Archival Resource Key (ARK) ou souscrire une offre de gestion d’identifiant, par le service EZID[5] de la California Digital Library (en) ou un autre prestataire.

L’adjectif « pérenne » correspond à une possibilité plus qu'à une caractéristique intrinsèque de l’identifiant. Sa durée dépend de l'entité gestionnaire des identifiants. Certains auteurs préféreraient qu'on parle d’« identifiant pérennisable » ((en) persistable identifier)[6].

La syntaxe[modifier | modifier le code]

Pour générer des noms non équivoques à l’échelle du monde entier, les systèmes d’identifiants pérennes définissent des syntaxes similaires :

  • un libellé spécifique à chaque type d’identifiant,
  • un élément d’identification du fournisseur de ressources responsable de l’attribution de l’identifiant,
  • un élément spécifique à la ressource. Ce dernier peut être nouvellement créé ou reprendre un identifiant interne du fournisseur (cote, numéro d’inventaire, etc.).
Exemples d'identifiants :
  • doi:10.1000/182
  • ark:/12148/btv1b8449691v

Malgré des tentatives, les libellés (doi:, ark:, etc.) n’ont pas été inscrits comme des schémas d’URI officiels, ce qui aurait permis de les rendre actionnables par machine tels quels. Il faut pour résoudre les identifiants les préfixer par le nom de domaine d’un résolveur.

Exemples d'identifiants préfixés :
  • https://doi.org/10.1000/182
  • https://n2t.net/ark:/12148/btv1b8449691v

Services associés[modifier | modifier le code]

Certains identifiants (DOI, ARK) permettent à l’utilisateur d’obtenir des métadonnées en plus de la ressource elle-même, dans un ou plusieurs schémas (schéma Datacite[7] pour DOI, Electronic Resource Citation[8] ou Dublin Core pour ARK).

Le standard ARK recommande également qu’une ressource à laquelle un fournisseur attribue un identifiant soit accompagnée d’un engagement de permanence de la part du fournisseur[9].

Différents types d’identifiants pérennes[modifier | modifier le code]

Il existe différents types d’identifiants pérennes selon le domaine – le type de ressource à laquelle un identifiant peut être attribué :

Certains identifiants ont un domaine plus large :

Notes et références[modifier | modifier le code]

  1. Ministère de la Culture et de la Communication, Identifiants pérennes pour les ressources numériques, , 11 p. (lire en ligne)
  2. (en) Robert Sanderson, Mark Phillips et Herbert Van de Sompel, « Analyzing the Persistence of Referenced Web Resources with Memento », Open Repositories 2011 Conference,‎ (lire en ligne)
  3. « FAQ sur les identifiants ARK », sur lyrasis.org, (consulté le 21 août 2020)
  4. (en) Tim Berners-Lee, « Cool URIs don't change », sur w3.org, (consulté le 21 août 2020)
  5. (en) California Digital Library, « Identifiers made easy », sur cdlib.org (consulté le 21 août 2020)
  6. (en) Lukas Koster, « Persistent identifiers for heritage objects », code{4}lib Journal, no 47,‎ (ISSN 1940-5758, lire en ligne)
  7. (en) Metadata Working Group, « DataCite Metadata Schema », sur datacite.org, (consulté le 21 août 2020)
  8. (en) John Kunze, The ARK Identifier Scheme, (lire en ligne), section 5.3
  9. (en) John Kunze, Scout Calvert, Jeremy D. DeBarry et Matthew Hanlon, « Persistence Statements: Describing Digital Stickiness », Data Science Journal, vol. 16,‎ , p. 39 (ISSN 1683-1470, DOI 10.5334/dsj-2017-039, lire en ligne, consulté le 21 août 2020)