Phylogénie moléculaire

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La phylogénie moléculaire est l'utilisation de séquences de macromolécules biologiques pour obtenir des informations sur l'histoire évolutive des êtres vivants, et notamment sur leurs liens de parenté (leur phylogénie). C'est un des outils d'étude de l'évolution moléculaire.
Le produit d'une analyse de phylogénie moléculaire est un arbre phylogénétique.

Les macromolécules biologiques telles que l'ADN, l'ARN ou les protéines sont des composants fondamentaux de tous les êtres vivants. Ces molécules sont des polymères constitué de l'enchaînement de briques moléculaire de base dont la succession constitue la séquence primaire. Ainsi, l'ADN peut être considéré comme un texte écrit dans un alphabet à 4 lettres: Adénine (A), Thymine (T), Guanine (G) et Cytosine (C) et les protéines comme un texte écrit dans un alphabet à 20 lettres, les 20 acides aminés. La parenté des êtres vivants considérés est reflétée par la similarité de ces séquences primaires.

Jusqu'à une date assez récente, la séquence primaire des molécules biologiques n'était pas directement accessible. Cependant, au cours des 20 dernières années, l'avènement de la PCR et du séquençage d'ADN par la méthode de Sanger ont permis un développement très important de cette approche, ce qui a eu pour conséquence de profondément remanier la vision traditionnelle de la classification des organismes. Malgré les problèmes qu'elle a pu rencontrer, la phylogénie moléculaire a ainsi permis de redonner un nouveau souffle à la science taxonomique en permettant de mieux comprendre l'évolution de certains traits morphologique des organismes. Par ailleurs, la phylogénie moléculaire peut être associée de domaines tels que la médecine légale ou les tests génétiques.

Les origines[modifier | modifier le code]

On peut considérer que la systématique moléculaire au sens large est née aux alentours de 1904, lorsque G.H.F. Nuttall utilisa pour la première fois les incompatibilités immunologiques entre primates pour estimer leur distance évolutive relative[1]. Des méthodes de plus en plus perfectionnées sont utilisées pour étudier les différences entre les protéines. D'une part les méthodes immunologiques comme l'immunodiffusion, appliquée à l'étude des liens de parentés des primates par Allan Wilson. D'autre part, l'électrophorèse des allozymes et isozymes. Les premières études basées sur l'ADN utilisèrent la méthode d'hybridation ADN-ADN mise au point par Charles Sibley et Jon Ahlquist. Cette technique permet d'évaluer la distance entre l'ADN de deux espèces en comparant les températures des dissociations de l'ADN double-brin hybride et fut utilisée avec un certain succès pour étudier les liens de parenté des oiseaux ou des primates[2]. Cependant ces méthodes étaient fondées sur l'évaluation de distances globales, sans possibilité d'évaluer l'homologie des caractères comparés, une condition indispensable à l'application de la méthode cladistique à la base de la phylogénétique moderne. Ce problème sera en grande partie résolu avec le séquençage de l'ADN (par Sanger), donnant accès direct à la séquence primaire des molécules, constituant le fondement de la phylogénie moléculaire au sens strict.

Quelles molécules utiliser ?[modifier | modifier le code]

Toutes les régions de l'ADN des organismes (et donc les protéines qu'elles codent), n'évoluent pas à la même vitesse ; certains gènes sont « contraints » car ils assurent des fonctions vitales pour les organismes (de faibles mutations pour ces gènes limitent drastiquement la viabilité de leurs porteurs). Inversement certaines régions, comme les gènes codant des marqueurs du système immunitaire évoluent rapidement. Ces types de marqueurs permettent donc d'étudier des relations évolutives à faible échelle, par exemple au sein d'une population ou entre espèces proches (par exemple, les primates avec l'exemple des travaux de Nuttall ou Wilson).
À l'opposé, pour étudier les relations entre tous les organismes vivants, des marqueurs tels que l'ARN ribosomique 12S et 16S (procaryotes) ou 18S et 28S (eucaryotes) sont généralement utilisés. Ces ARN structuraux sont impliqués dans les ribosomes, organites responsable de la traduction des ARNm en protéines dont la fonction est essentielle à la vie. Les progrès du séquençage ont permis d'augmenter le nombre de marqueurs disponibles pour réaliser des études de phylogénie moléculaires. Ainsi, les génomes mitochondriaux et chloroplastiques qui contiennent plus d'une dizaine de gènes ont été utilisés pour étudier les relations des animaux et des plantes, respectivement[3]. Plus récemment, l'augmentation des données de génomes ou de transcriptomes complets disponibles a rendu possible d'étudier l'ensemble des gènes dont l'homologie peut être vérfiée. Des jeux de données incluant une centaine de gènes sont aujourd'hui utilisés couramment pour résoudre les relations des eucaryotes ou des animaux, cette nouvelle approche est appelée phylogénomique[4].

Comment construire un arbre ?[modifier | modifier le code]

La mise en œuvre d'un arbre en phylogénie moléculaire passe par trois étapes :

  1. La construction du jeu de données incluant les séquences de un ou plusieurs gènes marqueurs dans un certain nombre de taxons d'intérêts. Ces séquences peuvent être nucléotidiques ou bien protéiques (acides aminés) si la portion d'ADN utilisée est codante.
  2. L'alignement des séquences de ce jeu de données pour obtenir une matrice de position homologues, c'est-à-dire qui dérivent chacune d'une position ancestrale commune. Cette étape passe généralement l'utilisation d'un programme d'alignement de séquences mais les imperfections des algorithmes requièrent bien souvent une édition manuelle des alignements, ainsi qu'une élimination des positions ambigües [5].
  3. L'inférence phylogénétique proprement dite par l'analyse de cette matrice de positions grâce à un programme implémentant un algorithme de reconstruction phylogénétique.

Malgré l'importance des deux premières étapes, une grande part des avancées de la phylogénie moléculaire est liée aux algorithmes de reconstruction proprement dite.

Classification des principales méthodes de reconstruction
Type de données
Méthode de reconstruction Distances Sites
Algorithme de clustering UPGMA, Neighbour joining
Critère d'optimisation Minimum d'évolution (ME) Maximum de parcimonie (MP) Maximum de vraisemblance (ML)

Parcimonie[modifier | modifier le code]

Distance[modifier | modifier le code]

Méthodes probabilistes[modifier | modifier le code]

Parmi les méthodes probabilistes on compte notamment le maximum de vraisemblance et l'inférence Bayésienne.

Découvertes et écueils[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

  • (fr)

Bibliographie[modifier | modifier le code]

Ouvrages de référence[modifier | modifier le code]

  • (fr) chapitre 9, Phylogénie moléculaire, dans l'ouvrage : Frédéric Thomas, Thierry Lefevre, Michel Raymond, 2010. Biologie évolutive. De Boeck. (ISBN 978-2-8041-0161-9)
  • (en) Felsenstein, J. 2004. Inferring phylogenies. Sinauer Associates Incorporated. (ISBN 0-87893-177-5).
  • (en) Hillis, D. M. & Moritz, C. 1996. Molecular systematics. 2nd ed. Sinauer Associates Incorporated. (ISBN 0-87893-282-8).
  • (en) Page, R. D. M. & Holmes, E. C. 1998. Molecular evolution: a phylogenetic approach. Blackwell Science, Oxford. (ISBN 0-86542-889-1).

Bibliographie approfondie[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Nuttall G.F.H. 1904. Blood Immunity and Blood relationships, Cambridge University Press
  2. C.G. Sibley and J.E. Ahlquist 1984. The Phylogeny of the Hominoid Primates, as Indicated by DNA-DNA Hybridization. J Mol Evol. 1:2-15. 
  3. Lang BF, Gray MW, Burger G. 1999. Mitochondrial genome evolution and the origin of eukaryotes. Annu Rev Genet. 33:351-97.
  4. Delsuc, F., Brinkmann, H., and Philippe, H. 2005. Phylogenomics and the reconstruction of the tree of life. Nature Reviews Genetics 6, 361-375.
  5. J. Castresana. Selection of Conserved Blocks from Multiple Alignments for Their Use in Phylogenetic Analysis. Molecular Biology and Evolution 17:540-552 (2000)