Loi de Skellam

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Loi de Skellam
Image illustrative de l'article Loi de Skellam
Densité de probabilité (ou fonction de masse)
La fonction n'est définie que sur les entiers.

Paramètres \mu_1\ge 0
\mu_2\ge 0
Support k\in\{\ldots, -2,-1,0,1,2,\ldots\}
Densité de probabilité (fonction de masse) e^{-(\mu_1+\mu_2)} \left(\frac{\mu_1}{\mu_2}\right)^{k/2}I_{|k|}(2\sqrt{\mu_1\mu_2})
Espérance \mu_1-\mu_2\,
Médiane N/A
Variance \mu_1+\mu_2\,
Asymétrie \frac{\mu_1-\mu_2}{(\mu_1+\mu_2)^{3/2}}
Kurtosis normalisé 1/(\mu_1+\mu_2)\,
Fonction génératrice des moments e^{-(\mu_1+\mu_2)+\mu_1e^t+\mu_2e^{-t}}
Fonction caractéristique e^{-(\mu_1+\mu_2)+\mu_1e^{it}+\mu_2e^{-it}}

En théorie des probabilités et en statistique, la loi de Skellam est la loi de probabilité discrète de la différence de deux variables aléatoires indépendantes \scriptstyle N_1 et \scriptstyle N_2 de loi de Poisson de paramètres respectifs \scriptstyle\mu_1 et \scriptstyle\mu_2.

Cette loi est utilisée pour décrire la différence entre deux images d'un bruit quantique ou pour comparer les résultats sportifs lors d'égalité des points dans certain sports tels que le baseball, le hockey sur glace et le football.

La fonction de masse de la loi de Skellam issue de deux lois de Poisson de paramètres \scriptstyle \mu_1 et \scriptstyle\mu_2 est donnée par :

 f(k;\mu_1,\mu_2)= e^{-(\mu_1+\mu_2)}\left({\mu_1\over\mu_2}\right)^{k/2}I_{|k|}(2\sqrt{\mu_1\mu_2})

I_k est la fonction de Bessel modifiée du première espèce.

Le nom de cette loi est issue du statisticien et biologiste John Gordon Skellam.

Construction[modifier | modifier le code]

La fonction de masse d'une loi de Poisson de paramètre \scriptstyle \mu est donnée par :

 f(n;\mu)={\mu^n\over n!}e^{-\mu}

pour \scriptstyle n \ge 0 (et 0 sinon). La loi de Skellam est la corrélation croisée de deux lois de Poisson (Skellam, 1946) :

  f(k;\mu_1,\mu_2)  =\sum_{n=-\infty}^\infty f(k\!+\!n;\mu_1)f(n;\mu_2)
  =e^{-(\mu_1+\mu_2)}\sum_{n=-\infty}^\infty {{\mu_1^{k+n}\mu_2^n}\over{n!(k+n)!}}.

Puisque la loi de Poisson est une loi sur les entiers positifs, tous les termes négatifs dans les factorielles de la somme précédente et fixés à zéro. Ceci implique :

\frac{f(k;\mu_1,\mu_2)}{f(-k;\mu_1,\mu_2)}=\left(\frac{\mu_1}{\mu_2}\right)^k

ainsi :

  f(k;\mu_1,\mu_2)= e^{-(\mu_1+\mu_2)} \left({\mu_1\over\mu_2}\right)^{k/2}I_{|k|}(2\sqrt{\mu_1\mu_2})

I_k est la fonction de Bessel du première espèce. Le cas spécial où \scriptstyle \mu_1=\mu_2(=\mu) est étudié par Irwin (1937), la fonction de masse est alors :

  f\left(k;\mu,\mu\right) = e^{-2\mu}I_{|k|}(2\mu).

On peut également remarquer qu'en utilisant les valeurs limites des fonctions de Bessel, on peut retrouver la loi de Poisson comme cas spécial de la loi de Skellam pour \scriptstyle\mu_2=0.

Propriétés[modifier | modifier le code]

En tant que probabilité, la fonction de masse est normalisée, c'est-à-dire : \sum_{k=-\infty}^\infty f(k;\mu_1,mu_2)=1.

Puisque la fonction génératrice des probabilités de la loi de Poisson est :G\left(t;\mu\right)=e^{\mu(t-1)} , la fonction génératrice des probabilités de la loi de Skellam est alors donnée par :

G(t;\mu_1,\mu_2) = \sum_{k=0}^\infty f(k;\mu_1,\mu_2)t^k
= G\left(t;\mu_1\right)G\left(1/t;\mu_2\right)\,
= e^{-(\mu_1+\mu_2)+\mu_1 t+\mu_2/t}.

Remarquons que la forme de la fonction génératrice implique que la loi des sommes des différences de variables aléatoires indépendantes de lois de Skellam est encore une loi de Skellam. Il est parfois dit que toute combinaison linéaire de deux variables aléatoires de loi de Skellam est encore de loi de Skellam. Cependant, ceci n'est valable que par multiplication par +/-1, sinon le support de la loi en serait changé.

La fonction génératrice des moments de la loi de Skellam est donnée par :

M\left(t;\mu_1,\mu_2\right) = G(e^t;\mu_1,\mu_2) = \sum_{k=0}^\infty { t^k \over k!}\,m_k

ce qui donne les moments \scriptstyle m_k. En définissant \Delta\ \stackrel{\mathrm{def}}{=}\  \mu_1-\mu_2 et \mu\ \stackrel{\mathrm{def}}{=}\   (\mu_1+\mu_2)/2, les moments sont donnés par :

m_1=\Delta \;,\; m_2=2\mu+\Delta^2 \text{ et }m_3=\Delta(1+6\mu+\Delta^2).

Les moments par rapport à la moyenne sont donnés par :

M_2=2\mu \;,\; M_3=\Delta \text{ et } M_4=2\mu+12\mu^2.

L'espérance, la variance, l'asymétrie et le kurtosis sont donnés respectivement par :

\mathbb E(n)=\Delta ,
\sigma^2=2\mu ,
\gamma_1=\Delta/(2\mu)^{3/2} ,
\gamma_2=1/2\mu .

La fonction génératrice des cumulants est donnée par :

 K(t;\mu_1,\mu_2)\ \stackrel{\mathrm{def}}{=}\   \ln(M(t;\mu_1,\mu_2)) = \sum_{k=0}^\infty { t^k \over k!}\,\kappa_k

qui donne les cumulants :

\kappa_{2k}=2\mu \text{ et }\kappa_{2k+1}=\Delta .

Pour le cas particulier où \scriptstyle \mu_1 =\mu_2, un développement asymptotique, pour \scriptstyle\mu grand, de la fonction de Bessel du première espèce donne (Abramowitz & Stegun 1972, p. 377) :

 f(k;\mu,\mu)\sim {1\over\sqrt{4\pi\mu}}\left[1+\sum_{n=1}^\infty (-1)^n{\{4k^2-1^2\}\{4k^2-3^2\}\cdots\{4k^2-(2n-1)^2\} \over n!\,2^{3n}\,(2\mu)^n}\right]

Pour ce cas particulier, lorsque k est grand d'ordre \scriptstyle O(\sqrt{2\mu}) la loi tend vers la loi normale :

 f(k;\mu,\mu)\sim {e^{-k^2/4\mu}\over\sqrt{4\pi\mu}}.

Références[modifier | modifier le code]

  • Abramowitz, M. and Stegun, I. A. (Eds.) (1972) "Modified Bessel functions I and K". Sections 9.6–9.7 in Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, 9th printing, p. 374-378. New York: Dover.
  • Irwin, J. O. (1937) "The frequency distribution of the difference between two independent variates following the same Poisson distribution." Journal of the Royal Statistical Society: Series A, 100 (3), 415-416. [1]
  • Karlis, D. and Ntzoufras, I. (2003) "Analysis of sports data using bivariate Poisson models". Journal of the Royal Statistical Society: Series D (The Statistician), 52 (3), 381–393. doi:10.1111/1467-9884.00366
  • Karlis D. and Ntzoufras I. (2006). Bayesian analysis of the differences of count data. Statistics in Medicine, 25, 1885-1905. [2]
  • Skellam, J. G. (1946) "The frequency distribution of the difference between two Poisson variates belonging to different populations". Journal of the Royal Statistical Society: Series A, 109 (3), 296. [3]