Taille du génome

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Arbre phylogénétique indiquant la taille des génomes chez les organismes des trois domaines du monde vivant: les bactéries Bacteria (en bleu), les archées Archaea (en vert) et les eucaryotes Eucarya (en rouge).

La taille du génome correspond à la quantité d'ADN contenue dans une copie d'un génome. La taille d'un génome est également appelée valeur C. Elle est mesurée soit par sa masse où on utilise le picogramme, noté pg comme unité, ou bien par le nombre de nucléotides (paires de bases) avec le Mégabase, notée Mb (1 million de nucléotides) comme unité : 1 pg correspond à 978 Mb[1] (cette équivalence posée entre le nombre de paires de bases et la masse en picogrammes est facilitée par le fait qu’une paire GC a une masse moléculaire très voisine d’une paire AT).

Origine du terme[modifier | modifier le code]

Le terme de "Taille du génome" est souvent attribué par erreur à Hinegardner[2], puisque Hinegardner utilisa ce terme en 1969 dans le sens "nombre de gènes". Par contre, en février 1969, Wolf et al. utilisèrent le terme "taille du génome" avec le sens actuel[3]. Le terme de "taille du génome" est devenu populaire au début des années 1970 sans doute à la suite de la publication du livre de Susumu Ohno, Evolution by Gene Duplication[4].

Conversion de picogrammes (pg) en paire de bases (bp)[modifier | modifier le code]

ou simplement:

[1]

Évolution de la taille du génome[modifier | modifier le code]

La taille des génomes eucaryotes est très variable. Le parasite intracellulaire Encephalitozoon cuniculi a un génome de 2,8 Mb (2,8 millions de paires de bases) alors que l'amibe Polychaos dubnium pourrait avoir un génome de 675 Gb (milliards de paires de bases), bien que cette estimation ancienne soit contestée[5]. Ces variations peuvent également être importantes au sein d'un même groupe : la taille du génome chez les arthropodes varie de l'ordre de 250 fois, chez les poissons de 350 fois et chez les angiospermes de 1000 fois. La variation des tailles de génome est due à une différence de tolérance à l'augmentation du génome ainsi qu'à un taux de perte d'ADN différent suivant les espèces. Par exemple, le génome relativement compact de la mouche Drosophila melanogaster est dû à un taux de perte d'ADN par délétion élevé et bien supérieur à celui des mammifères[6]. De plus, il est apparu qu'il n'existait pas de corrélation entre la taille du génome et la complexité d'un organisme. Cette observation a été appelée le paradoxe de la valeur C.

Enfin, contrairement à l'opinion courante, l'histoire évolutive du vivant ne se confond avec l'histoire de sa complexification (au niveau des organismes et au niveau génomique) car il semble que la réduction du génome soit le mode dominant de l'évolution[7].

Réduction du génome[modifier | modifier le code]

La réduction de la taille d'un génome est une règle générale chez les virus et les procaryotes. La relation ou règle de Drake chez ces organismes montre une relation inversement proportionnelle entre la taille de génomes de ces microbes et une estimation de leurs taux de mutation spontané global (en moyenne une mutation par génome toutes les 200 générations cellulaires, mutation se produisant lors de la réplication de l'ADN, ou sous l'effet d'agents mutagènes, composés chimiques divers, rayons ultraviolets, radioactivité, radicaux libres issus du métabolisme cellulaire). Cette réduction du génome peut également se produire lors d'erreurs des mécanismes de réparation de l'ADN[8].

Cette réduction a été également mis en évidence chez des parasites eucaryotes (Par exemple:Encephalitozoon cuniculi) ou bien chez des symbiontes intracellulaires (Par exemple:Buchnera aphidicola). Dans le cas de symbiontes intracellulaires, la réduction du génome est accompagnée d'un transfert de gène du symbionte vers le noyau de la cellule hôte. Ce processus est à la base de la théorie endosymbiotique de l'origine des mitochondries et des chloroplastes.

Expansion du génome[modifier | modifier le code]

La relation de Drake n'est valable que pour les virus et les procaryotes, car chez les eucaryotes, la relation serait en sens inverse[9].

Les mécanismes sont:

Chez les plantes, l'amplification des rétrotransposons LTR semble être une cause importante de la variation de la taille du génome. Ainsi, 70 % du génome du maïs est composé de rétrotransposons LTR. Cette expansion de rétrotransposon a induit le doublement du génome du maïs en quelques millions d'années[10]. Chez les arthropodes, le taux de perte d'ADN semble être le facteur essentiel pour la variation des tailles de génome. Ainsi, le criquet d'hawaï a un génome 11 fois supérieur à celui de la mouche Drosophila melanogaster et un taux de perte d'ADN 40 fois inférieur[6]. Chez les bactéries, la taille du génome est corrélée avec le taux de gènes dupliqués[11].

Les données de génomique structurale montrent que la taille d'un génome n'est pas proportionnelle à la complexité de l'organisme : c'est le paradoxe de la valeur C. Par exemple, la taille du génome du petit pois est 1,5 fois plus grande que celle de l'homme, celle du riz cultivé est dix fois plus grande[12]. Ce paradoxe est attribué au taux relatif d'expansion des séquences répétitives dispersées selon la lignée, et à la délétion de séquences sans grande importance. Ces séquences répétitives représentent à peine quelques pour cent de certains génomes eucaryotiques comme ceux de la levure et de la drosophile, mais plus de 50 % du génome humain et plus et plus de 90 % du génome d'espèces aussi diverses que certains criquets, des liliacées et des amibes[13].

Implication évolutive[modifier | modifier le code]

La taille du génome est un « trait biologique » important car elle corrèle avec la taille cellulaire et nucléaire, le taux d'activité métabolique et la durée de la mitose et de la méiose[14]. Cependant, plusieurs modèles ont été proposés pour expliquer la fonction sélective et l'origine de la variation de la taille du génome. Une des explications de l'origine est l'importance de l'ADN non codant (appelé improprement « ADN poubelle ») constitué notamment de séquences répétées qui ont un rôle dans la régulation de l'expression des gènes[15]. L'hypothèse du généticien Michael Lynch (en), appelée parfois « hypothèse du péril mutationnel » (mutational hazard hypothesis ou MH), a eu un grand impact en génomique évolutive par son élégance et sa capacité à expliquer de nombreuses caractéristiques évolutives des génomes eucaryotes. Reposant sur la génétique des populations, elle propose que la taille efficace de population (en) a un impact décisif sur la taille des génomes. En effet, l’efficacité de la sélection pour limiter la propagation des gènes égoïstes (ou de toute séquence d’ADN qui peut à terme interférer avec la valeur sélective de l’organisme), augmente avec la taille efficace de population. Les espèces avec de petites tailles efficaces de populations telles que les hommes auraient tendance à accumuler de l’ADN non codant dans leur génome, alors que les espèces aux grandes tailles (communautés bactériennes) maintiendraient des petits génomes denses en séquences fonctionnelles et dépourvues de sources inutiles de mutations souvent délétères[16].

Taille des génomes d'espèces modèles[modifier | modifier le code]

Organisme Taille du génome (Mpb) Nombre de gènes protéiques estimés
Virus Virus de la grippe 0,013
Bactériophage λ 0,05
Bactériophage T4 0,165
Mimivirus 1,2 1 260
Bactéries Mycoplasma pneumoniae 0,816 689
Pelagibacter ubique 1,3 1 354
Haemophilus 1,8 1 657
Staphylococcus aureus 2,8 2 619
Bacillus subtilis 4,2 4 106
Escherichia coli 4,64 4 243
Archaea Nanoarchaeum equitans 0,49 536
Pyrococcus abyssi 1,77 1 898
Sulfolobus solfataricus 3 2 977
Eucaryotes Encephalitozoon cuniculi 2,9 1 996
Saccharomyces cerevisiae (levure) 12 5 863
Plasmodium falciparum 21,8 5 314
Caenorhabditis elegans (nématode) 100 22 628
Drosophila melanogaster (mouche) 118 16 548
Arabidopsis thaliana (plante) 119 27 379[17]
Populus trichocarpa (peuplier) 485 45 500
Zea mais (maïs) 5 000 54 606[18]
Mus musculus (souris) 3 400 30 000
Homo sapiens (homme) 3 400 26 517
Polychaos dubium (amibe) 675 000

Avant qu'il soit séquencé, le génome humain était supposé contenir environ 100 000 gènes. Cette estimation a été revue à la baisse par la suite, et est actuellement de l'ordre de 24 000 - du même ordre que la plante Arabidopsis thaliana (27 379 gènes).

La séquence complète du dernier chromosome dans le génome humain (chromosome 1, le plus grand, contenant à lui seul 8 % de ce génome) a été obtenue en mai 2006.

Plus grand génome[modifier | modifier le code]

La fleur japonaise Paris japonica, du genre Paris a le génome eucaryote le plus vaste décrit : il comporte près de 150 milliards de paires de base, soit près de 50 fois la taille du génome humain[19]. Ceci est à considérer en excluant le génome de l'Amibe Polychaos dubium (≈700 Gpb) du fait de la précision incertaine de la méthode de mesure de son génome et de par le niveau de polyploïdie de l'espèce en question[20].

Références[modifier | modifier le code]

  1. a et b (en) Dolezel J, Bartoš J, Voglmayr H, Greilhuber J, « Nuclear DNA content and genome size of trout and human », Cytometry A, vol. 51, no 2,‎ , p. 127-128 (PMID 12541287)
  2. (en) Hinegardner R, Molecular Evolution, Sinauer Associates, Inc., Sunderland, , « Evolution of genome size », p. 179-199
  3. (en) Wolf U, Ritter H, Atkin NB, Ohno S, « Polyploidization in the fish family Cyprinidae, Order Cypriniformes. I. DNA-content and chromosome sets in various species of Cyprinidae », Humangenetik, vol. 7,‎ , p. 240-244
  4. Ohno S, Evolution by Gene Duplication, New York, Springer-Verlag,
  5. (en) Casey L. McGrath et Laura A. Katz, « Genome diversity in microbial eukaryotes », Trends in Ecology & Evolution, vol. 19,‎ , p. 32–38 (DOI 10.1016/j.tree.2003.10.007, lire en ligne)
  6. a et b Petrov DA, et al. Evidence for DNA loss as a determinant of genome size Science, 2000, 287, 1060-1062
  7. (en) YI Wolf, EV Koonin, « Genome reduction as the dominant mode of evolution », Bioessays, vol. 35, no 9,‎ , p. 829-837 (DOI 10.1002/bies.201300037).
  8. (en) J W Drake, « A constant rate of spontaneous mutation in DNA-based microbes », Proc Natl Acad Sci USA, vol. 88, no 16,‎ , p. 7160–7164 (DOI 10.1073/pnas.88.16.7160).
  9. (en) M. lynch, « Evolution of the mutation rate », Trends Genet, vol. 26, no 8,‎ , p. 345-352.
  10. SanMiguel P, Bennetzen JL, Evidence that a recent increase in maize genome size was caused by the massive amplification of intergene retrotransposons. Ann. Bot. (Lond.), 1998 82:37–44
  11. Gevers D, Vandepoele K, Simillion C, Van der Peer Y, Gene duplication and biased functional retention of paralogs in bacterial genomes Trends in Microbiology. 2004 April;12(4):341-5.
  12. Norbert Latruffe, Françoise Bleicher-Bardeletti, Bertrand Duclos, Joseph Vamecq, Biochimie, Dunod, , p. 160.
  13. Greg Gibson, Spencer V. Muse, Précis de génomique, De Boeck Supérieur, , p. 101.
  14. Petrov DA. Evolution of genome size: new approaches to an old problem Trends Genet 2001 17 (1), 23-28
  15. Jean Deutsch, Le Gène. Un concept en évolution, Le Seuil, , p. 87.
  16. (en) M. Lynch et al, « The repatterning of eukaryotic genomes by random genetic drift », Annu Rev Genomics Hum Genet, vol. 12, no 1,‎ , p. 347–366 (DOI 10.1146/annurev-genom-082410-101412).
  17. « TAIR9 Genome release » (consulté le 22 juillet 2009) : « The TAIR9 release contains 27,379 protein coding genes, 4827 pseudogenes or transposable elements and 1312 ncRNAs (33,518 genes in all, 39,640 gene models) »
  18. « Release Version » (consulté le 22 juillet 2009)
  19. Pellicer J, Fay M, Leitch IJ, The largest eukaryotic genome of them all?, Botanical Journal of the Linnean Society, 2010;164:10–15
  20. T. Ryan Gregory, « Synergy between sequence and size in Large-scale genomics », Nature Reviews Genetics, vol. 6,‎ (DOI 10.1038/nrg1674, lire en ligne)

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]