Base de données bibliographiques

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Les base de données bibliographiques répertorient toute catégorie d'objets bibliographiques : livres, collections, revues, articles de revues etc. Elles sont le fruit de l'informatisation des catalogues de bibliothèque, et permettent des recherches à l'aide de mots-clefs (titre, auteur, etc.) ainsi que l'analyse des données (bibliométrie, etc.). WorldCat est l'exemple d'une telle base de données.

Historique et terminologie[modifier | modifier le code]

Les bases bibliographiques ou plus précisément les bases de références bibliographiques se créent à partir des années 1960[1].

Dans les années 60-70, le terme banque de données est privilégié. Il désigne alors des bases, à l'époque fréquemment de références bibliographiques, relatives "à un domaine défini de connaissances et organisé[ées] pour être offert aux consultations d'utilisateurs"[2] [3]. Ce terme permettait de distinguer ces systèmes documentaires des logiciels eux-mêmes ou systèmes de gestion de base de données (SGBD).

Les bases de données bibliographiques évoluent, en particulier depuis les années 2000, selon deux axes qui peuvent se combiner :

Caractéristiques[modifier | modifier le code]

Structure des données[modifier | modifier le code]

Le terme base de donnée utilisé ici doit être compris avec précaution. En effet, il s'agit plutôt d'une collection de données ou de notices bibliographiques. Cette structure apparemment simple peut cacher des facteurs de complexité.

La structure des enregistrements peut être relativement élémentaire (simple collection de champs), plus complexe avec des formats MARC (ou conformes à la norme ISO 2709), et maintenant d'une structure quelconque avec XML.

Par rapport aux bases de données relationnelles, un facteur de complexité vient de l'impossibilité de figer la taille des données. Pratiquement tous les champs sont de longueur variable avec des facteurs de répétition pouvant devenir très importants. Par exemple, un nom d'auteur fait en moyenne moins de 10 caractères, mais on trouve des auteurs de plus de 100 caractères. Un article scientifique possède en moyenne 2 ou 3 auteurs mais on peut trouver des articles de physique avec 500 auteurs.

Indexation et référentiels[modifier | modifier le code]

De nombreuses bases de données bibliographiques contiennent des informations décrivant le contenu à l'aide d'une liste de termes d'indexation ou mots-clés. Ces mots-clés appartiennent souvent à des référentiels terminologiques dont la nature est variable : simple liste de mots contrôlés, plan de classement, thésaurus ou ontologie.

Outre l'indexation, de nombreuses données peuvent se référer à des référentiels spécialisés, comme, par exemple, les titres de périodique ou les affiliations.

Enfin certaines bases codifient également les références de la bibliographie des articles traités, comme le Science Citation Index, et la base bibliographique devient alors son propre référentiel.

Thématique et couverture[modifier | modifier le code]

Les bases bibliographiques sont également définies en fonction des thématiques choisies. Elles peuvent influencer considérablement la structure de la base (par exemple, en sciences de la vie la codifications des gènes).

Une base se définit également par sa couverture, ou plus précisément la façon dont la base est constituée. Dans bien des cas (Medline, Pascal) la couverture est définie par un ensemble de revues qui sont systématiquement dépouillées.

Exemples[modifier | modifier le code]

  • Chemical Abstracts — Articles scientifiques en chimie — Origine américaine, Chemical Abstracts Service (CAS)
  • Francis — Articles scientifiques en sciences humaines et sociales — Origine française (CNRS, INIST) — résumés en français — indexation bilingue (Français, Anglais).
  • Google Scholar — Origine société Google, États-Unis.
  • Medline — Science de la vie et médecine — Origine administration américaine (National Library of Medecine)
  • Pascal - Science Technique et Médecine - Origine française (CNRS, INIST)— indexation bilingue (Français, Anglais).
  • WorldCat — catalogue collectif OPAC ((monographies et périodiques) — Origine OCLC (États-Unis) — parfois citée comme le plus grande base bibliographique mondiale.
  • Open Library - Catalogue collectif du projet Internet Archive.
  • Urbamet — base de données bibliographiques - origine association Urbamet, France - la principale base de données française sur l'urbanisme, l'aménagement du territoire, les villes, l'habitat et le logement, l'architecture, les équipements collectifs, les transports, les collectivités locales etc. qui rassemble et diffuse la mémoire de l’aménagement, de l’urbanisme et de l’habitat.
  • SantéPsy - base de données bibliographiques - origine Ascodocpsy - principale base de données française sur la psychiatrie et la santé mentale.

Notes et références[modifier | modifier le code]

  1. Carbone Pierre, Les bibliothèques, Paris, Presses Universitaires de France « Que sais-je ? », 2012, 128 pages.ISBN : 9782130594550
  2. Définition donnée dans l'arrêté du 22 Décembre 1981, Journal Officiel, 17 janvier 1982, p. 624. Consultable sur France Terme, la base des termes recommandés au Journal officiel de la République française - http://www.culture.fr/franceterme (consulté le 22 novembre 2014)
  3. Voir aussi la définition donnée dans le Vocabulaire de la documentation, ADBS, 2004 - http://www.adbs.fr/banque-de-donnees-16252.htm (consulté le 22 novembre 2014)
  4. Histoire des bases de données juridiques en France (1) - les origines, Infostratèges, 2005
  5. Des formes éditoriales composites: Les revues Françaises de chimie, Sylvie Dalbin, Revue de Synthèse, Septembre 2014, Volume 135, n°2-3, pp 221-238. DOI - 10.1007/s11873-014-0254-y (consulté le 22 novembre 2014)

Article connexe[modifier | modifier le code]