Loi du χ² non centrée

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Loi du \chi^{2} non centré
Image illustrative de l'article Loi du χ² non centrée
Densité de probabilité (ou fonction de masse)

Image illustrative de l'article Loi du χ² non centrée
Fonction de répartition

Paramètres k > 0\, (degrés de liberté)

\lambda > 0\, paramètre de décentralisation

Support x \in [0; +\infty[\,
Densité de probabilité (fonction de masse) \frac{1}{2}e^{-(x+\lambda)/2}\left (\frac{x}{\lambda} \right)^{k/4-1/2}
 I_{k/2-1}(\sqrt{\lambda x})
Fonction de répartition 1 - Q_{\frac{k}{2}} \left( \sqrt{\lambda}, \sqrt{x} \right) avec la fonction Q de Marcum Q_M(a,b)
Espérance k+\lambda\,
Variance 2(k+2\lambda)\,
Asymétrie \frac{2^{3/2}(k+3\lambda)}{(k+2\lambda)^{3/2}}
Kurtosis normalisé \frac{12(k+4\lambda)}{(k+2\lambda)^2}
Fonction génératrice des moments \frac{\exp\left(\frac{ \lambda t}{1-2t }\right)}{(1-2 t)^{k/2}} for 2t<1
Fonction caractéristique \frac{\exp\left(\frac{i\lambda t}{1-2it}\right)}{(1-2it)^{k/2}}

En théorie des probabilités et en statistique, la loi du \chi^{2} non centrée est une loi de probabilité qui généralise la loi du χ². Cette loi apparait lors de tests statistiques, par exemple pour le maximum de vraisemblance.

Motivations[modifier | modifier le code]

Soit X_i, k variables aléatoires indépendantes de loi normale de moyennes \mu_i et variances \sigma_i^2. Alors la variable aléatoire

\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2

suit une loi du \chi^{2} non centrée. Elle dépend de deux paramètres : k qui spécifie le nombre de degrés de liberté (c'est-à-dire le nombre de X_i), et \lambda qui est en lien avec la moyenne des variables X_i par la formule :

\lambda=\sum_{i=1}^k \left(\frac{\mu_i}{\sigma_i}\right)^2.

\lambda est parfois appelé le paramètre de décentralisation. Certaines références définissent \lambda différemment, comme la moyenne de la somme ci-dessus ou comme sa racine carrée.

Cette loi apparait en statistique multivariée, elle est issue de la loi normale multidimensionnelle. Comme la loi du χ² est le carré de la norme du vecteur aléatoire défini à partir des variables de loi \mathcal N(0_k,I_k) (c'est-à-dire le carré de la distance entre l'origine et un point donné par cette loi), la loi du \chi^{2} non centrée est le carré de la norme d'un vecteur aléatoire de loi \mathcal N(\mu,I_k). Ici 0_k est le vecteur nul de longueur k, \mu = (\mu_1, ..., \mu_k) et I_k est la matrice unité de taille k.

Définition[modifier | modifier le code]

La densité de probabilité est donnée par :

\begin{cases} f_X(x; k,\lambda) = \sum_{i=0}^\infty \dfrac{e^{-\lambda/2} (\lambda/2)^i}{i!} f_{Y_{k+2i}}(x) & \text{ si }x>0 \\ 0 & \text{ sinon}\end{cases}

Y_q est de loi du χ² à q degrés de liberté.

De cette représentation, la loi du \chi^{2} non centrée est vue comme un loi mélange de loi du \chi^{2}. Supposons que la variable J suit une loi de Poisson avec moyenne \lambda/2, et que la loi conditionnelle de Z sachant J=i est la loi du \chi^{2} à k+2i degrés de liberté. Alors la loi (non conditionnelle) de Z est la loi du \chi^{2} non centrée à k degrés de liberté, et avec paramètre de décentralisation \lambda.

D'une autre part, la densité peut être écrite sous la forme

f_X(x;k,\lambda)=\frac{1}{2} e^{-(x+\lambda)/2} \left (\frac{x}{\lambda}\right)^{k/4-1/2} I_{k/2-1}(\sqrt{\lambda x})

I_\nu(z) est la fonction de Bessel modifiée du premier type donnée par

 I_a(y) = (y/2)^a \sum_{j=0}^\infty \frac{ (y^2/4)^j}{j! \Gamma(a+j+1)} .

En utilisant la relation entre les fonctions de Bessel et hypergéométrique, la densité peut également être écrite sous la forme[1] :

f_X(x;k,\lambda)={{\rm e}^{-\lambda/2}} _0F_1(;k/2;\lambda x/4)\frac{1}{2^{k/2}\Gamma(k/2)} {\rm e}^{-x/2} x^{k/2-1}.

Siegel (1979) considère plus particulièrement le cas k=0 (0 degré de liberté), dans ce cas la loi est atomique en 0.

Propriétés[modifier | modifier le code]

Fonction génératrice des moments[modifier | modifier le code]

La fonction génératrice des moments est donnée par

M(t;k,\lambda)=\frac{\exp\left(\frac{ \lambda t}{1-2t }\right)}{(1-2 t)^{k/2}}.

Moments[modifier | modifier le code]

Les premiers moments sont :

\mu^'_1=k+\lambda
\mu^'_2=(k+\lambda)^2 + 2(k + 2\lambda)
\mu^'_3=(k+\lambda)^3 + 6(k+\lambda)(k+2\lambda)+8(k+3\lambda)
\mu^'_4=(k+\lambda)^4+12(k+\lambda)^2(k+2\lambda)+4(11k^2+44k\lambda+36\lambda^2)+48(k+4\lambda)

Les premiers moments centrés sont :

\mu_2=2(k+2\lambda)\,
\mu_3=8(k+3\lambda)\,
\mu_4=12(k+2\lambda)^2+48(k+4\lambda)\,

Le n-ième cumulant est

K_n=2^{n-1}(n-1)!(k+n\lambda).\,

Ainsi

\mu^'_n = 2^{n-1}(n-1)!(k+n\lambda)+\sum_{j=1}^{n-1} \frac{(n-1)!2^{j-1}}{(n-j)!}(k+j\lambda )\mu^'_{n-j}.

Fonction de répartition[modifier | modifier le code]

En utilisant encore la relation entre les lois du \chi^{2} centrée et non centrée, la fonction de répartition peut s'écrire sous la forme

P(x; k, \lambda ) = e^{-\lambda/2}\; \sum_{j=0}^\infty  \frac{(\lambda/2)^j}{j!} Q(x; k+2j)

Q(x; k)\, est la fonction de répartition de la loi du \chi^{2} à k degrés de liberté donnée par :

Q(x;k)=\frac{\gamma(k/2,x/2)}{\Gamma(k/2)}\,
et où \gamma(k,z)\, est la fonction gamma incomplète.

La fonction Q de Marcum Q_M(a,b) peut également être utilisée pour formuler la fonction de répartition[2] :

P(x; k, \lambda) = 1 - Q_{\frac{k}{2}} \left( \sqrt{\lambda}, \sqrt{x} \right)

Approximation[modifier | modifier le code]

Sankaran[3] propose plusieurs formes approchées de la fonction de répartition. Dans un article précédent[4], il formule l'expression suivante :

 P(x; k, \lambda ) \approx \Phi \left[ \frac{(\frac{x}  {k + \lambda}) ^ h - (1 + h  p  (h - 1 - 0.5 (2 - h)  m  p))}  {h  \sqrt{  2p}  (1 + 0.5 m  p)} \right]

 \Phi ( \cdot ) \, est la fonction de répartition de la loi normale,
 h = 1 - \frac{2}{3} \frac{(k+ \lambda)  (k+ 3  \lambda)}{(k+ 2  \lambda) ^ 2} \, ,
 p = \frac{k+ 2  \lambda}{(k+ \lambda) ^ 2} ,
 m = (h - 1)  (1 - 3  h) \, .

Cette approximation ainsi que d'autres sont données dans un livre ultérieure[5] .

Pour approcher la loi du \chi^{2}, le paramètre de décentralisation  \lambda\, est égal à zéro.


Liens avec d'autres lois[modifier | modifier le code]

Transformations[modifier | modifier le code]

Sankaran (1963) étudie les transformations de la forme z=[(X-b)/(k+\lambda)]^{1/2}. Il analyse le développement des cumulants de z de l'ordre de O((k+\lambda)^{-4}) et montre que les choix suivants de b donnent les résultats raisonnables suivants :

  • b=(k-1)/2 rend le second cumulant de z approximativement indépendant de \lambda,
  • b=(k-1)/3 rend le troisième cumulant de z approximativement indépendant de \lambda,
  • b=(k-1)/4 rend le quatrième cumulant de z approximativement indépendant de \lambda.

De plus, une transformation plus simple, z_1 = (X-(k-1)/2)^{1/2}, peut être utilisée comme fonction de stabilisation de variance qui produit une variable aléatoire de moyenne (\lambda + (k-1)/2)^{1/2} et de variance O((k+\lambda)^{-2}).

L'utilisation de ces transformations peut être altérée par le fait de considérer les racines carrées de nombres négatifs.

Différentes lois du \chi et \chi^2
Lois en fonction de variables de loi normale
loi du χ² \sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2
loi du χ² non centrée \sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2
loi du χ \sqrt{\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2}
loi du χ non centrée \sqrt{\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2}

Références[modifier | modifier le code]

  1. Muirhead (2005) Theorem 1.3.4
  2. Nuttall, Albert H. (1975): Some Integrals Involving the QM Function, IEEE Transactions on Information Theory, 21(1), 95-96, (ISSN 0018-9448)
  3. Sankaran, M. (1963). Approximations to the non-central chi-squared distribution Biometrika, 50(1-2), 199–204
  4. Sankaran, M. (1959). "On the non-central chi-squared distribution", Biometrika 46, 235–237
  5. Johnson et al. (1995) Section 29.8
  6. Muirhead (2005) pages 22–24 and problem 1.18.
  • Abramowitz, M. and Stegun, I.A. (1972), Handbook of Mathematical Functions, Dover. Section 26.4.25.
  • Johnson, N. L., Kotz, S., Balakrishnan, N. (1970), Continuous Univariate Distributions, Volume 2, Wiley. ISBN 0-471-58494-0
  • Muirhead, R. (2005) Aspects of Multivariate Statistical Theory (2nd Edition). Wiley. ISBN 0471769851
  • Siegel, A.F. (1979), "The noncentral chi-squared distribution with zero degrees of freedom and testing for uniformity", Biometrika, 66, 381–386