Phase ouverte de lecture

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir ORF.

Une phase ouverte de lecture, ou cadre ouvert de lecture, (en anglais open reading frame, ou ORF) est une séquence d'ARN débutant par un codon-start et se terminant par un codon-stop. On peut considérer également qu'une phase ouverte de lecture correspond seulement à un fragment codant dans lequel on ne trouve pas de codon-stop. Entre ces deux codons, la phase ouverte de lecture contient un certain nombre de codons codant potentiellement une protéine. La présence d'un codon initiateur (ex : AUG), à l'intérieur d'un ORF, peut permettre de retrouver des CDS (Coding DNA Sequence). Ces CDS sont toujours dans un ORF et débutent par un codon initiateur et finissent, dans la plupart des cas, par le codon stop à la position de fin de l'ORF. La région située entre le début de l'ORF et le premier CDS présent dans cet ORF se nomme séquence 5'UTR.

On reconnaît le plus souvent les phases ouvertes de lecture codant des protéines par leur longueur. Le code génétique comportant 64 codons dont 3 codons-stop, la longueur moyenne d'une phase de lecture dans une séquence « aléatoire » est d'une vingtaine de codons. Les chaînes protéiques, dont la longueur moyenne est de 300 à 400 acides aminés, sont associées à des phases ouvertes de 300 à 400 codons, qui sont donc facilement reconnaissables par rapport au bruit de fond.

Ces séquences sont utilisées pour la prédiction de gènes.

Description[modifier | modifier le code]

Chaque séquence d'ARN peut contenir 3 phases de lecture décalées d'un nucléotide les unes par rapport aux autres (+1 ou -1). Sur l'ADN, il peut y avoir transcription en ARN de l'un ou l'autre des deux brins, ce qui conduit à un total de 6 phases de lecture.

La recherche des phases ouvertes a été facilitée par l'apparition d'outils bioinformatiques performants. Cette recherche est plus facile chez les procaryotes que les eucaryotes, les gènes de ces derniers étant composés d'une succession d'introns et d'exons.

Liens externes[modifier | modifier le code]

  • Projet EMBOSS - une interface web pour extraire les ORF d'une séquence génétique
  • Bioinformatics.org - une interface web pour extraire les ORF d'une séquence génétique