Test de Shapiro-Wilk

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Shapiro et Wilk.

En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon x1, ..., xn est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Shapiro et Martin Wilk[1].

La statistique de test est:

W = {\left(\sum_{i=1}^n a_i x_{(i)}\right)^2 \over \sum_{i=1}^n (x_i-\overline{x})^2}

  • x(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre , i.e., le ième plus petit nombre dans l'échantillon;
  • \overline{x} = \tfrac{1}{n} (x_1 + \cdots +x_n) est la moyenne de l'échantillon;
  • la constante ai est donnée par[2]
(a_1,\dots,a_n) = {m^\top V^{-1} \over (m^\top V^{-1}V^{-1}m)^{1/2}}
m = (m_1,\dots,m_n)^\top\,
et m1, ..., mn sont les espérances des statistiques d'ordre d'un échantillon de variables indépendantes et identiquement distribuée suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.

L'utilisateur devra rejeter l'hypothèse nulle si W est trop petit[3].

Il peut être interprété avec un Q-Q plot ou droite de Henry.

Interprétation[modifier | modifier le code]

Sachant que l'hypothèse nulle est que la population est normalement distribuée, si la p-value est inférieure au niveau alpha choisi, alors l'hypothèse nulle est rejetée (i.e. on conclut que les données ne sont pas issues d'une population normalement distribuée). Si la p-value est supérieure au niveau alpha choisi, alors on ne peut pas rejeter l'hypothèse nulle selon laquelle les données sont issues d'une population normalement distribuée. Par exemple, pour un niveau alpha de 0.05, un jeu de données avec une p-value de 0.32 n'entraîne pas le rejet de l'hypothèse nulle selon laquelle les données sont issues d'une population normalement distribuée.[1]

Voir aussi[modifier | modifier le code]

Références[modifier | modifier le code]

  1. (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, no 3-4,‎ 1965, p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709)
  2. op cit p. 593
  3. op cit p. 605

Liens externes[modifier | modifier le code]