Test de Student

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Page d'aide sur l'homonymie Pour la loi de probabilité, voir Loi de Student.

En statistique, le test de Student, ou test t, est un ensemble de tests statistiques paramétriques où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.

Histoire[modifier | modifier le code]

Le test de Student et la loi de Student qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[1]. Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemple d'utilisation[modifier | modifier le code]

  • Comparaison de moyenne d'une loi normale à une valeur si la variance est connue.
  • Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues, ou si leurs variances sont différentes et inconnues (Test t de Welch).
  • Test sur les coefficients dans le cadre d'une régression linéaire.
  • Test sur des échantillons appariés

Exemple : test de Student sur un échantillon de loi normale[modifier | modifier le code]

On veut comparer la moyenne d’une population de loi normale et d’écart type non connu à une valeur déterminée . Pour ce faire, on tire de cette population un échantillon de taille dont on calcule la moyenne empirique et l'on remplace sa variance par son estimateur sans biais .

Selon l’hypothèse nulle, la distribution d’échantillonnage de cette moyenne se distribue elle aussi normalement avec un écart type .

La statistique de test :

suit alors une loi de Student à n-1 degrés de liberté sous l'hypothèse nulle (c'est le théorème de Cochran).

On choisit un risque α, généralement 0,05 ou 0,01 et l'on calcule la réalisation de la statistique de test :

  • Si l'on veut tester :

Si est supérieur au quantile d'ordre de la loi de Student à n-1 degrés de liberté alors on rejette l'hypothèse nulle.

  • Si l'on veut tester

Si z est supérieur au quantile d'ordre de la loi de Student à n-1 degrés de liberté alors on rejette l'hypothèse nulle.

  • Si l'on veut tester

Si z est inférieur au quantile d'ordre de la loi de Student à n-1 degrés de liberté alors on rejette l'hypothèse nulle.

Remarque : si l'on note le quantile d'ordre de la loi de Student à k degré de liberté alors on a l'égalité

Implémentation[modifier | modifier le code]

  • t.test avec la bibliothèque "stats" de R[2].
  • PROC TTEST avec SAS[3].

Notes et références[modifier | modifier le code]

  1. Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans On Student's 1908 paper "The probable error of the mean", Journal of the American Statistical Association 103 (2008), p. 1-7 DOI:10.1198/016214508000000030 JSTOR:27640017
  2. « R: Student's t-Test », sur stat.ethz.ch (consulté le 8 février 2018)
  3. (en) « SAS/STAT(R) 9.2 User's Guide, Second Edition », sur support.sas.com (consulté le 8 février 2018)

Voir aussi[modifier | modifier le code]