Test de Student

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur les redirections Pour la loi de probabilité, voir Loi de Student.

Le test de Student, ou test t, est un ensemble de tests d’hypothèse paramétriques où la statistique calculée suit une loi de Student lorsque l’hypothèse nulle est vraie. Un test de Student peut être utilisé notamment pour tester statistiquement l’hypothèse d’égalité de l'espérance de deux variables aléatoires suivant une loi normale et de variance inconnue. Il est aussi très souvent utilisé pour tester la nullité d'un coefficient dans le cadre d'une régression linéaire.

Histoire[modifier | modifier le code]

Le test de Student et la distribution de Student qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de stout. La compagnie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset plaida que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[1]. Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui lui fait voir que son test ne couvre pas un grand ensemble. Ronald Fisher lui ajouta des modifications au test de Student en vue de le généraliser.

Principe[modifier | modifier le code]

Le principe du test de Student est le suivant : on veut déterminer si la valeur d’espérance μ d’une population de distribution normale et d’écart type σ non connu est égale à une valeur déterminée μ0. Pour ce faire, on tire de cette population un échantillon de taille n dont on calcule la moyenne \overline{x} et l'écart-type empirique s.

Selon l’hypothèse nulle, la distribution d’échantillonnage de cette moyenne se distribue elle aussi normalement avec un écart type \frac{s}{\sqrt{n}}.

La variable:

 t = \frac{\overline{x} - \mu_0}{s / \sqrt{n}},

suit alors une loi de Student à n-1 degrés de liberté (car \overline{x} et s sont indépendantes, voir Théorème de Cochran).

où :

 \overline{x} = \frac{1}{n}\sum_{i=1}^{n}x_i
 s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\overline{x})^{2}}

On peut ensuite utiliser une table des valeurs de la distribution de loi de Student pour voir si la valeur de la statistique est supérieure (en valeur absolue pour un test bilatéral) au quantile à 95% ou 99% et donc rejeter ou non l'hypothèse nulle. Une erreur fréquente est de valider l'hypothèse nulle alors que le test ne permet que de réfuter à raison l'hypothèse avec un niveau de confiance élevé (95% ou 99% généralement).

Notes et références[modifier | modifier le code]

  1. Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans On Student's 1908 paper "The probable error of the mean", Journal of the American Statistical Association 103 (2008), pp.1-7 DOI:10.1198/016214508000000030 JSTOR 27640017

Voir aussi[modifier | modifier le code]