Phase ouverte de lecture

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir ORF.

En génétique moléculaire, une phase de lecture ouverte, ou cadre de lecture ouvert (open reading frame ou ORF en anglais), est une partie d'un cadre de lecture susceptible d'encoder une protéine ou un peptide. Il s'agit d'une séquence d'acide nucléique dépourvue de codon stop (généralement UAA, UGA ou UGA sur l'ARN messager). Un codon d'initiation, généralement AUG, situé dans le cadre de lecture ouvert (pas nécessairement en position initiale) peut indiquer le début de la traduction génétique. Le site de terminaison de la transcription est situé après le cadre de lecture ouvert, au-delà du codon stop indiquant la fin de la traduction.

Chez les eucaryotes, les gènes contiennent généralement plusieurs exons, de sorte que les cadres de lecture ouverts s'étendent sur plusieurs exons ; ces derniers sont épissés pour en éliminer les introns dans l'ARN messager afin de reconstituer la séquence codante (coding DNA sequence ou CDS en anglais), laquelle est toujours incluse dans un cadre de lecture ouvert avec, à l'amont de la séquence codante, la région 5’ non traduite (5’-UTR) et, en aval de la séquence codante, la région 3’ non traduite (3’-UTR).

On reconnaît le plus souvent les phases de lecture ouverts qui encodent des protéines à leur longueur. Le code génétique comportant 64 codons dont trois codons-stop, la longueur moyenne d'une phase de lecture dans une séquence « aléatoire » est d'une vingtaine de codons. Les chaînes protéiques, dont la longueur moyenne est de 300 à 400 acides aminés, sont associées à des phases ouvertes de 300 à 400 codons, qui sont donc facilement reconnaissables par rapport au bruit de fond.

Ces séquences sont utilisées pour la prédiction de gènes.

Description[modifier | modifier le code]

Chaque séquence d'ADN peut contenir trois cadres de lecture décalés d'un nucléotide les uns par rapport aux autres (+1 ou -1). Sur l'ADN, il peut y avoir transcription en ARN de l'un ou l'autre des deux brins, ce qui conduit à un total de six cadres de lecture.

La recherche des phases ouvertes a été facilitée par l'apparition d'outils bioinformatiques performants. Cette recherche est plus facile chez les procaryotes que chez les eucaryotes, les gènes de ces derniers étant composés d'une succession d'introns et d'exons.

Liens externes[modifier | modifier le code]

  • Projet EMBOSS - une interface web pour extraire les ORF d'une séquence génétique
  • Bioinformatics.org - une interface web pour extraire les ORF d'une séquence génétique