Loi de Markov-Pólya

Un article de Wikipédia, l'encyclopédie libre.

Loi de Markov-Pólya
Paramètres

Support
Fonction de masse
Espérance
Variance
Fonction génératrice des probabilités

En mathématiques et plus particulièrement en théorie des probabilités, la loi de Markov-Pólya[1] (ou loi de Pólya-Eggenberger[2] ou loi de Pólya[3]) est une loi de probabilité discrète. Elle doit son nom au mathématicien George Pólya (ainsi qu'aux mathématiciens F Eggenberger et Andreï Markov) qui a publié un article[4], conjointement avec Eggenberger, en 1923 sur cette loi ainsi que sur le problème d'urne sous-jacent. Cependant Markov serait le premier à avoir étudié cette loi en 1917[5].

Définition[modifier | modifier le code]

Considérons une urne contenant a boules blanches et b boules noires (pour un total de m = a + b boules). Nous répétons l'expérience suivante n fois : on pioche uniformément au hasard une boule dans l'urne, puis, on replace la boule piochée ainsi que h autres boules de la même couleur dans l'urne. La loi de Markov-Pólya de paramètres a, b, h et n est alors la loi de la variable aléatoire X qui compte le nombre total de boules blanches piochées au bout de ces n tirages.

La fonction de masse de la variable X peut se calculer et on a[6],[7]

où on a utilisé la notation[3] suivante .

Les paramètres a, b et n sont des entiers naturels tandis que h est un entier relatif, il peut donc être négatif[8]. Lorsque h est négatif on rajoute la condition pour éviter tout problème de définition.

Propriétés[modifier | modifier le code]

Soit X une variable aléatoire ayant la loi de Markov-Pólya de paramètres a, b, h et n.

  • Si h = 0, alors X suit une loi binomiale de paramètres n et p = a/m.
  • Si h = −1, alors X suit une loi hypergéométrique de paramètres n, p = a/m et N = m.
  • Si h = 1, alors X suit une loi bêta-binomiale de paramètres 𝛼 = a, 𝛽 = b et n.
  • Lorsque h ≠ 0 on peut réécrire la fonction de masse de X des manières suivantes :

désigne la factorielle croissante et désigne un coefficient binomial généralisé[9].

  • L'espérance de X est donnée par .

Il est intéressant de noter que l'espérance ne dépend pas du paramètre h.

  • La variance de X est donnée par .
  • Plus généralement, si h ≠ 0 alors le r-ième moment factoriel de X est donnée par[7]

désigne la factorielle décroissante.

  • La fonction génératrice des probabilités de X vérifie[7]

désigne la fonction hypergéométrique.

Limites[modifier | modifier le code]

  • Soit Xn une variable aléatoire ayant la loi de Markov-Pólya de paramètres a, b, h > 0 (fixés) et n. On a la convergence en loi suivante[10] :

B désigne la loi bêta. En fait la convergence a lieu pour la distance de Wasserstein à tous les ordres avec pour vitesse de convergence 1/n. Cela implique en particulier la convergence de tous les moments vers ceux de la loi bêta.

  • Soit Xn une variable aléatoire ayant la loi de Markov-Pólya de paramètres a, b, h > 0 (dépendant de n) et n. Supposons que et que quand n tend vers l'infini. Alors Xn converge en loi[11] vers une loi binomiale négative[12] de paramètres r et p = 1/(1+𝜃).
  • D'autres limites sont possibles (par exemple vers une loi gaussienne lorsque h = 0) en changeant la manière dont évoluent les paramètres en fonction de n[13].

Généralisation[modifier | modifier le code]

On peut généraliser la loi de Markov-Pólya en considérant non plus 2 mais q > 2 couleurs de boules différentes dans l'urne avec a1 boules blanches, a2 boules noires, a3 boules rouges, etc. Dans ce cas si X représente le vecteur du nombre de boules tirées par couleur après n tirages alors on a[6]:

.

Il est toujours possible de calculer la fonction génératrice multivariée de X en utilisant les fonctions hypergéométriques.

Pour a1, ... , aq, h > 0 (fixés) et n qui tend vers l'infini, on a convergence en loi[10] du vecteur vers une loi de Dirichlet de paramètres a1/h, ... , aq/h.

Notes et références[modifier | modifier le code]

  1. (en) K G Janardan, « On Characterizing the Markov-Polya Distribution », The Indian Journal of Statistics, vol. 46,‎ , p. 444-453 (lire en ligne)
  2. (en) Anwar Hassan, Sheikh Bilal et Imtiyaz Ahmad Shah, « On Some Properties and Estimation of Size-Biased Polya-Eggenberger Distribution », Journal of Modern Applied Statistical Methods, vol. 11,‎ , article no 10 (lire en ligne)
  3. a et b (en) Héctor M Ramos, David Almorza et Juan A. Garcia–Ramos, « On characterizing the Polya distribution », ESAIM: Prob. and Stat., vol. 6,‎ , p. 105-112 (lire en ligne)
  4. (de) F Eggenberger et G Polya, « Über die Statistik verketteter Vorgänge », Z. Angew. Math. Mech., vol. 3,‎ , p. 279-289 (lire en ligne)
  5. (ru) A A Markov, « Sur quelques formules limites du calcul des probabilités », Bulletin de l’Académie Impériale des Sciences, vol. 11,‎ , p. 177-186
  6. a et b Charles Jordan, « Sur un cas généralisé de la probabilité des épreuves répétées », C. R. Acad. Sci. Paris, vol. 184,‎ , p. 315-317 (lire en ligne)
  7. a b et c Charles Jordan, « Sur un cas généralisé de la probabilité des épreuves répétées »
  8. Si h < 0 on retire la boule piochée et on retire aussi |h| − 1 boules de la même couleur que la boule piochée.
  9. Plus précisément, pour x entier positif et z réel, on définit le coefficient binomial de la manière suivante : . La généralisation peut encore être poussée en utilisant la fonction gamma mais ce n'est pas nécessaire dans notre cas.
  10. a et b (en) Svante Jordan, « Rate of convergence for traditional Polya urns », Journal of Applied Probability, vol. 57(4),‎ , p. 1029-1044 (lire en ligne)
  11. (en) Dietmar Willi Pfeifer, « Pólya–Lundberg Process », Encyclopedia of Statistical Sciences,‎ (lire en ligne)
  12. On entend ici une loi binomiale négative généralisée à une paramétrisation réelle. Plus précisément, Z suit une loi binomiale négative de paramètres r (réel positif) et p (réel entre 0 et 1) si et seulement si Cette loi binomiale négative généralisée est aussi parfois appelée loi de Polya (ou loi de Polya-Eggenberger) ce qui peut créer des confusions avec la loi de Markov-Polya.
  13. F Eggenberger et G Polya, « Calcul des probabilités – sur l’interprétation de certaines courbes de fréquence », C. R. Acad. Sci. Paris, vol. 187,‎ , p. 870-872 (lire en ligne)

Voir aussi[modifier | modifier le code]