Séquence (acide nucléique)

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 3 août 2015 à 21:01 et modifiée en dernier par Bob Saint Clar (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
(en) Séquence d'un ARN messager faisant apparaître ses codons.

La séquence d'un acide nucléiqueADN ou ARN — est la succession des nucléotides qui le constituent. Cette succession contient l'information génétique portée par ces polynucléotides, de sorte qu'on la qualifie également de séquence génétique. Elle peut être déterminée par des méthodes de séquençage de l'ADN.

Les séquences nucléotidiques sont conventionnellement écrites dans le sens 5’ → 3’, qui est celui dans lequel sont lues et synthétisées ces biomolécules. Les nucléotides sont représentés conventionnellement par des lettres symbolisant la base nucléique qui les caractérise ; l'IUPAC a défini une nomenclature précise pour écrire les séquences d'acides nucléiques selon l'information que l'on souhaite représenter :

Symbole[1] Description Bases représentées
A adénine A 1
C cytosine C
G guanine G
T thymine T
U uracile U
W weak A T 2
S strong C G
M amino A C
K keto G T
R purine A G
Y pyrimidine C T
B pas A (B vient après A) C G T 3
D pas C (D vient après C) A G T
H pas G (H vient après G) A C T
V pas T (V vient après T et U) A C G
N ou - any base A C G T 4

Dans la mesure où les acides nucléiques sont des molécules le plus souvent linéaires, leur séquence nucléotidique définit entièrement les liaisons chimiques qui les constituent, de sorte que leur séquence nucléotidique se confond avec leur structure primaire.

Notes et références

  1. (en) Nomenclature Committee of the International Union of Biochemistry (NC-IUB), « Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences », sur IUBMB, (consulté le )

Liens internes