Centimorgan

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

Le centimorgan, de symbole cM, est une unité mesurant le lien entre deux gènes. Cette grandeur est une transformation directe du taux de recombinaison, et ainsi, se comporte comme lui : plus sa valeur entre deux gènes est faible, plus les gènes sont dits proches (ou liés), et plus la probabilité que ces gènes soient trasmis ensemble à la génération suivante lors de la méiose (sous forme d'haplotype) est grande.

Cette grandeur a été construite pour qu'elle possède les propriétés d'une distance (on parle la plupart du temps de distance en centimorgan), ce qui la rend particulièrement intéressante et pratique pour modéliser les recombinaisons le long du génome. Toutefois, bien qu'elle en a les propriétés, cette grandeur n'est pas une distance physique: la relation entre la distance en centimorgan et la distance physique (en nombre de paires de bases) n'est ni constante ni universelle. Cette relation varie selon les espèces, mais aussi le long du génome au sein d'un même organisme: par exemple, chez les Humains 1cM correspond en moyenne à 1 mégabase, alors que chez Arabidopsis thaliana 1cM correspond en moyenne à 200 kilobases.[1][réf. insuffisante]

Le centimorgan a été nommé ainsi en l'honneur du généticien Thomas Hunt Morgan par Alfred Sturtevant, l'un de ses étudiants .

Exemple de recombinaison chez l'homme[modifier | modifier le code]

Supposons deux gènes liés sur un même chromosome, c'est-à-dire très proches l'un de l'autre et ne se séparant pas par enjambement lors de la méiose. Par exemple dans le système de groupe sanguin MNS, sans considérer les nombreux variants mineurs de ce système, le gène codant une protéine, la glycophorine A (GPA), possède deux allèles M et N, et le gène codant une seconde protéine, la glycophorine B (GPB), possède deux allèles S et s. Il y a donc 4 haplotypes possibles dans ce système : MS, Ms, NS, Ns. Supposons un père ayant reçu de ses parents les haplotypes MS et Ns donc de génotype MS/Ns et de phénotype MNSs, marié à une femme homozygote MS/MS de phénotype MMSS. Leurs enfants seront nécessairement MS de par leur mère, et seront MS ou Ns de par leur père, mais ne pourront pas être Ms ou NS de par leur père. À moins d'une exceptionnelle recombinaison, dont la fréquence de survenue dans les familles donne une idée de la distance entre les gènes exprimée en centimorgans, les enfants MM seront nécessairement SS, et les enfants MN seront nécessairement Ss.

Haplotypes maternels
MS MS
Haplotypes paternels MS MS / MS MS / MS
Ns MS / Ns MS / Ns

Ainsi, dans l'exemple précédent, sur 4 enfants, 2 sont MMSS, et deux MNSs. Si nous connaissons à l'origine les haplotypes paternels, nous concluons qu'il n'y a aucun recombinant. Si, ce qui serait exceptionnel, nous observions dans cette famille un cinquième enfant qui serait MNSS (l'ensemble des autres marqueurs confirmant la paternité), ce serait un recombinant, et nous dirions que le pourcentage de recombinaison dans cette dernière famille est d'un enfant sur cinq, soit 20 %, donc que la distance entre les deux gènes est d'environ 11 centimorgans: en effet, si r est le taux de recombinaison, alors la distance d en centimorgan est égale à -100*0.5 log(1-2r) [2]. Si nous ne connaissons pas les haplotypes parentaux, la probabilité de recombinaison calculée n'est pas exactement la même du fait que les haplotypes parentaux sont déterminés à partir des enfants. Il fallait donc un grand nombre de familles (nombreuses de préférence) d'au moins deux enfants et/ou des familles étudiées sur trois générations, pour estimer, avant la biologie moléculaire, une distance exprimée en centimorgans.

La méthode des lod scores permet de cumuler les rapports, à la probabilité sous l'hypothèse d'indépendance, des probabilités d'observations calculées pour divers taux de recombinaison au sein de chaque famille étudiée. En effet, en exprimant en logarithmes décimaux les rapports calculés pour chaque taux choisi, on obtient des scores que l'on peut additionner au fur et à mesure des nouvelles familles étudiées. Le score le plus élevé obtenu pour un taux donné, correspond au maximum de vraisemblance.

Cette méthode d'étude familiale permettait, avant la biologie moléculaire, de déterminer non seulement une fréquence de recombinaison entre deux gènes, mais également l'ordre des gènes sur le chromosome lorsque trois gènes, ou plus, étaient liés.

Recombinaison chez les végétaux[modifier | modifier le code]

Le centimorgan détermine la distance entre 2 gènes (ou plus), on peut déterminer cette distance grâce aux gamètes recombinants et aux gamètes parentaux. Les gamètes parentaux sont les gamètes qui portent les allèles des parents alors que les gamètes recombinés sont les gamètes ayant subi l'enjambement. Prenons l'exemple de pois : [jaune + lisse] x [vert et ridé] en F1, on obtient 100 % de Jv Lr

La fréquence de recombinaison est "r". La fréquence de gamètes parentaux: en proportion représente 1-r la fréquence de gamètes recombinés est r

on a:

JL = (1-r)/2

vr = (1-r)/2


Jr = (r)/2

vL = (r)/2

Sur 100 gamètes produits, r auront subi une recombinaison.


Un modèle animal, la drosophile[modifier | modifier le code]

Chez l'animal, l'utilisation de modèles comme la drosophile, nombreux individus petits à la reproduction rapide, à l'alimentation frugale, 4 gros chromosomes polytènes bien visibles dans les cellules des glandes salivaires, a permis à T. H. Morgan et ses disciples de suivre plusieurs générations d'individus au fil des semaines, et de théoriser l'origine (située sur le chromosome) et conséquences (crossing over, carte génétique...) de la génétique mendélienne.

La probabilité de recombinaison n'est pas identique chez toutes les espèces, et à l'intérieur d'une même espèce, n'est pas exactement la même chez le mâle et la femelle.

Le taux de recombinaison le long des chromosomes de la drosophile peut être estimé grâce au "Recombination Rate Calculator".

Notes et références[modifier | modifier le code]

  1. Meiotic recombination hotspots in plants de C. Mézard. Biochem Soc Trans. (2006) 34:531-4
  2. (en) JBS Haldane, « The combination of linkage values and the calculation of distances between the loci of linked factors », Journal of Genetics 8.29,‎ , p. 299-309 (lire en ligne)

Voir aussi[modifier | modifier le code]