Utilisateur:Adwiladan/Processus de coalescence

Une page de Wikipédia, l'encyclopédie libre.

Un processus de coalescence est un processus aléatoire modélisant la fusion progressive de différents blocs d'une partition d'un ensemble. Le processus inverse est appelé processus de fragmentation, et correspond à une succession de divisions des différents blocs de la partition. Le premier exemple de processus de coalescence est dû à J. F. C. Kingman[1]. Par la suite, des généralisations ont été introduites par J. Pitman[2] et S. Sagitov[3].

Ces processus trouvent des applications en génétique des populations, où ils sont utilisés pour modéliser la généalogie d'un échantillon d'individus (ou plus précisément d'un échantillon de gènes), ce qui permet d'obtenir des informations sur l'histoire évolutive d'une population à partir de sa composition génétique. Ce domaine de la génétique des populations est usuellement désigné sous le terme théorie de la coalescence.

Généralités[modifier | modifier le code]

Définition[modifier | modifier le code]

Un processus de coalescence est un processus de Markov qui prend ses valeurs dans l'ensemble des partitions des entiers[4]. De plus, un processus de coalescence doit être décroissant pour l'inclusion : doit pouvoir s'obtenir à partir de en fusionnant un ou plusieurs de ses blocs. Un exemple de réalisation d'un processus de coalescence sur est donc

Arbre de coalescence correspondant à l'exemple donné ci-contre.

Un processus de coalescence peut également être à temps continu. Un tel processus doit alors être tel que pour tout et , s'obtient à partir de en fusionnant un ou plusieurs de ses blocs.

Interprétation généalogique[modifier | modifier le code]

Un tel processus s'interprète naturellement en terme de l'arbre généalogique d'un groupe d'individus : chaque bloc de la partition regroupe les individus qui possèdent un ancêtre commun générations dans le passé.

Le coalescent de Kingman[modifier | modifier le code]

L'exemple le plus étudié de processus de coalescence est le coalescent de Kingman[1] (du nom du mathématicien qui l'a introduit).

Le coalescent de Kingman sur les n premiers entiers[modifier | modifier le code]

Un processus de coalescence est un coalescent de Kingman sur les n premiers entiers si

  • est la partition des entiers de 1 à n en singletons : ,
  • si le nombre de blocs dans est , la fusion suivante a lieu après un temps aléatoire de loi exponentielle de paramètre , cette fusion a lieu entre deux blocs choisis uniformément au hasard parmi ceux de .

De manière équivalente, chaque paire de blocs fusionne après un temps aléatoire de loi exponentielle de paramètre 1, indépendamment de toutes les autres paires de blocs.

Coalescent de Kingman sur les 50 premiers entiers.

Le coalescent de Kingman sur [modifier | modifier le code]

Il est possible de généraliser cette définition à un processus à valeurs dans l'ensemble des partitions de , de la manière suivante.

Un processus de coalescence est un coalescence de Kingman sur si

  • est la partition des entiers en singletons : ,
  • chaque paire de blocs fusionne après un temps aléatoire de loi exponentielle de paramètre 1, indépendamment de toutes les autres paires de blocs.

Trace du coalescent de Kingman[modifier | modifier le code]

Si est un coalescent de Kingman, on peut définir sa trace sur les premiers entiers comme la restriction de la partition à l'ensemble . En d'autres termes, deux entiers et entre 1 et sont dans le même bloc dans si et seulement s'ils sont dans le même bloc dans .

La trace sur d'un coalescent de Kingman sur est un coalescent de Kingman sur les premiers entiers.

Âge de l'ancêtre commun le plus récent[modifier | modifier le code]

Si désigne le premier instant (aléatoire) pour lequel il ne reste plus qu'un seul bloc dans la partition , alors .

Vitesse de descente de l'infini[modifier | modifier le code]

Bien qu'il y ait initialement un nombre infini de blocs, les premières fusions sont très rapides, puisque l'intervalle entre deux fusions dépend du nombre de blocs présents. Si désigne le nombre de blocs dans , alors presque sûrement, pour tout , . On dit que le coalescent de Kingman descend de l'infini. De plus, on a également le résultat suivant[5], qui donne la vitesse à laquelle se fait la descente de l'infini.

Théorème — Presque sûrement,

Utilisation en génétique des populations[modifier | modifier le code]

Les processus de coalescence, et le coalescent de Kingman en particulier, sont très utilisés en génétique des populations, dans le cadre de ce qu'on appelle la théorie de la coalescence. Cela tient au fait que le coalescent décrit dans un sens très précis la généalogie d'un échantillon d'individus dans plusieurs modèles mathématiques introduits en génétique des populations[6].

En observant la séquence d'un gène chez un échantillon d'individus, il est possible d'estimer la forme de l'arbre généalogique le plus probable pour le gène en question. En effet l'ADN accumule des mutations génération après génération, et plus deux gènes partagent de mutations, plus il est probable qu'ils aient un ancêtre commun récent.

Généralisations[modifier | modifier le code]

Lambda coalescents[modifier | modifier le code]

Recombinaison[modifier | modifier le code]

Références[modifier | modifier le code]

  1. a et b J. F. C. Kingman, « The coalescent », Stochastic Processes and their Applications, vol. 13,‎ , p. 235–248 (DOI 10.1016/0304-4149(82)90011-4, lire en ligne, consulté le )
  2. Pitman, « Coalescents with Multiple Collisions », The Annals of Probability, vol. 27,‎ (lire en ligne, consulté le )
  3. Serik Sagitov, « The general coalescent with asynchronous mergers of ancestral lines », Journal of Applied Probability, vol. 36,‎ , p. 1116–1125 (ISSN 0021-9002 et 1475-6072, DOI 10.1239/jap/1032374759, lire en ligne, consulté le )
  4. (en) Jim Pitman, Combinatorial Stochastic Processes: Ecole d'Eté de Probabilités de Saint-Flour XXXII - 2002, Springer Science & Business Media, (ISBN 9783540309901, lire en ligne)
  5. Julien Berestycki, Nathanaël Berestycki et Vlada Limic, « THE Λ-COALESCENT SPEED OF COMING DOWN FROM INFINITY », The Annals of Probability, vol. 38,‎ , p. 207–233 (lire en ligne, consulté le )
  6. (en) Alison Etheridge, Some Mathematical Models from Population Genetics: École D'Été de Probabilités de Saint-Flour XXXIX-2009, Springer Science & Business Media, (ISBN 9783642166310, lire en ligne)

Pitman, Kingman, Nordborg, Sagitov, Etheridge