Test de Shapiro-Wilk

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Type	Test de normalité
Nommé en référence à	Samuel Sanford Shapiro, Martin Wilk
Formule	$W={\left(\sum \limits _{i=1}^{n}a_{i}x_{(i)}\right)^{2} \over \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}$

En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon $x_{1},\dots ,x_{n}$ est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Sanford Shapiro et Martin Wilk^[1].

Théorie[modifier | modifier le code]

La statistique de test $W$ est:

W={\left(\sum \limits _{i=1}^{n}a_{i}x_{(i)}\right)^{2} \over \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}

où

x_(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre, i.e., le ième plus petit nombre dans l'échantillon;
${\overline {x}}={\tfrac {1}{n}}(x_{1}+\cdots +x_{n})$ est la moyenne de l'échantillon;
la constante a_i est donnée par ^[2]

(a_{1},\dots ,a_{n})={m^{\top }V^{-1} \over (m^{\top }V^{-1}V^{-1}m)^{1/2}}

où

m=(m_{1},\dots ,m_{n})^{\top }\,

et $m_{1},\dots ,m_{n}$ sont les espérances des statistiques d'ordre d'un échantillon de variables iid suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.

Pour conclure, $W$ est alors comparé à une table^[3].

Interprétation[modifier | modifier le code]

Sachant que l'hypothèse nulle est que la population est normalement distribuée,

si la p-value est inférieure à un niveau alpha choisi (par exemple 0.05), alors l'hypothèse nulle est rejetée (i.e. il est improbable d'obtenir de telles données en supposant qu'elles soient normalement distribuées).
si la p-value est supérieure au niveau alpha choisi (par exemple 0.05), alors on ne doit pas rejeter l'hypothèse nulle. La valeur de la p-value alors obtenue ne présuppose en rien de la nature de la distribution des données.

Voir aussi Q-Q plot ou droite de Henry.

Mise en œuvre[modifier | modifier le code]

shapiro.test() avec R.

Voir aussi[modifier | modifier le code]

Références[modifier | modifier le code]

↑ (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, n^os 3-4,‎ 1965, p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709).
↑ Shapiro et Wilk 1965, p. 593.
↑ Shapiro et Wilk 1965, p. 605.

Liens externes[modifier | modifier le code]

Portail des probabilités et de la statistique

[1] (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, n^os 3-4,‎ 1965, p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709).

[ShapiroWilk1965593-2] Shapiro et Wilk 1965, p. 593.

[ShapiroWilk1965605-3] Shapiro et Wilk 1965, p. 605.

[1]

[2]

[3]