Numéro d'accession (bioinformatique)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Un numéro d'accession (le terme français est numéro d'ordre, numéro d'accession étant un anglicisme maladroit couramment utilisé) en bio-informatique est un identifiant unique donné à toute séquence d'ADN ou de protéine enregistrée dans un dépôt. Ce numéro permet un suivi des différentes versions d'une séquence enregistrée et des séquences associées. Du fait de sa relative stabilité, les numéros d'accession peuvent être utilisés comme clés étrangères pour toute référence à une séquence ou à un ensemble de séquences. Tous les dépôts contenant des informations de séquences mettent en œuvre ce concept de "numéro d'accession" mais peuvent introduire de subtiles variations.

Numéros d'accession dans des bases de données spécifiques[modifier | modifier le code]

UniProt (SwissProt) Knowledgebase[modifier | modifier le code]

Article principal : UniProt.

La documentation fournie par UniProt stipule que le rôle d'un numéro d'accès est "de fournir un moyen stable d'identifier une entrée d'une version à l'autre." Une entrée peut être associée à plusieurs numéros d'accession. Ainsi, chez UniProt, il n'y a pas de relation spécifique entre un numéro d'accession et une séquence : le numéro d'accession se réfère à une entrée dans la base de connaissance (knowledgebase), cette entrée pouvant se référer à un ensemble de séquences. Dans la version en fichier simple d'une entrée, le champ AC correspond à un numéro d'accession, le premier étant le "numéro d'accession primaire" et les numéros suivants étant les "numéros d'accession secondaires". Le champ principal pour le suivi d'une entrée UniProt est le numéro d'accession primaire. Les différents numéros d'accession associés à une entrée de la base de connaissance proviennent de l'historique des fusions et fractionnements de cette entrée. Un nouveau numéro d'accession peut être généré de deux manières : l'enregistrement d'une nouvelle séquence (le plus souvent) ou le fractionnement d'une entrée de la base de connaissance (plus rarement)[1].

GenBank[modifier | modifier le code]

Article principal : GenBank.

EMBL[modifier | modifier le code]

Article principal : EMBL.

DDBJ[modifier | modifier le code]

Article principal : DDBJ.

Numéros d'accession communément rencontrés[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. (en) Amos Bairoch, Rolf Apweiler, Cathy H. Wu, « User Manual », UniProt Knowledgebase (consulté le 20 octobre 2005)