Séquence (acide nucléique)

(en) Séquence d'un ARN messager faisant apparaître ses codons.

La séquence d'un acide nucléique — ADN ou ARN — est la succession des nucléotides qui le constituent. Cette succession contient l'information génétique portée par ces polynucléotides, de sorte qu'on la qualifie également de séquence génétique. Elle peut être déterminée par des méthodes de séquençage de l'ADN.

Les séquences nucléotidiques sont conventionnellement écrites dans le sens 5’ → 3’, qui est celui dans lequel sont lues et synthétisées ces biomolécules. Les nucléotides sont représentés conventionnellement par des lettres symbolisant la base nucléique qui les caractérise ; l'IUPAC a défini une nomenclature précise pour écrire les séquences d'acides nucléiques selon l'information que l'on souhaite représenter :

Symbole^[1]	Description	Bases représentées
A	adénine	A				1
C	cytosine		C
G	guanine			G
T	thymine				T
U	uracile				U
W	weak	A			T	2
S	strong		C	G
M	amino	A	C
K	keto			G	T
R	purine	A		G
Y	pyrimidine		C		T
B	pas A (B vient après A)		C	G	T	3
D	pas C (D vient après C)	A		G	T
H	pas G (H vient après G)	A	C		T
V	pas T (V vient après T et U)	A	C	G
N ou -	any base	A	C	G	T	4

Dans la mesure où les acides nucléiques sont des molécules le plus souvent linéaires, leur séquence nucléotidique définit entièrement les liaisons chimiques qui les constituent, de sorte que leur séquence nucléotidique se confond avec leur structure primaire.

Notes et références

↑ (en) Nomenclature Committee of the International Union of Biochemistry (NC-IUB), « Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences », sur IUBMB, 1984 (consulté le 8 avril 2015)

Liens internes

[IUBMB-1] (en) Nomenclature Committee of the International Union of Biochemistry (NC-IUB), « Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences », sur IUBMB, 1984 (consulté le 8 avril 2015)

[1]