Test de Student

Type	Test statistique, test paramétrique (d)
Inventeur	William Gosset (« Student »)

En statistique, un test de Student^[1], ou test t^[2], désigne n'importe quel test statistique paramétrique où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.

Histoire

Le test de Student et la loi de probabilités qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset^[3]. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de bière stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe^[4].

Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemples d'utilisation

Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

Le test t a plusieurs utilisations dont voici les plus fréquentes :

Comparaison de moyenne d'une loi normale à une valeur si la variance est inconnue.
Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée le test t de Welch.
Test sur les coefficients dans le cadre d'une régression linéaire.
Test sur des échantillons appariés^[pas clair]

Test de Student sur un échantillon de loi normale

On considère une population de loi normale de moyenne $μ$ et d'écart type $σ$ . L'écart type $σ$ n'est pas connu. On souhaite tester si la moyenne $μ$ est égale à une valeur déterminée $μ 0$ . L'hypothèse nulle est $H 0 : μ = μ 0$ , autrement dit on suppose a priori que la moyenne vaut $μ 0$ . On se place maintenant sous l'hypothèse nulle.

Cadre

On considère un échantillon de taille $n$ de cette population $(X_{1},\dots ,X_{n})$ , autrement dit, selon l'hypothèse nulle, chaque $X_{i}$ est une variable aléatoire qui suit une loi normale de moyenne $μ 0$ et d'écart type $σ$ . De plus, les $X_{i}$ sont indépendantes. On estime alors la moyenne par la moyenne empirique :

${\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}$ .

Comme l’hypothèse nulle est supposée vraie, la moyenne ${\overline {X}}$ suit également une loi normale d'espérance $μ 0$ , mais d'écart type $σ / \sqrt n$ . Comme la variance $σ 2$ est inconnue, on l'estime par son estimateur sans biais (on note la division par $n-1$ au lieu de $n$ afin d'avoir un estimateur sans biais) :

S_{n}^{\ast ^{2}}={\frac {1}{n-1}}\sum \limits _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}

.

Définition de la statistique

D'après le théorème de Cochran, sous l'hypothèse nulle, ${\frac {n-1}{\sigma ^{2}}}S_{n}^{\ast ^{2}}$ suit une loi du chi deux à $n - 1$ degrés de liberté.

On pose la statistique de test suivante :

Z={\sqrt {n}}{\frac {{\overline {X}}-\mu _{0}}{S_{n}^{\ast }}}

Par définition, la statistique $Z$ suit une loi de Student à $n - 1$ degrés de liberté. La réalisation de la statistique de test :

z={\sqrt {n}}{\frac {{\overline {x}}_{n}-\mu _{0}}{s_{n}^{\ast }}},

où

s_{n}^{\ast }={\sqrt {{\frac {1}{n-1}}\sum \limits _{i=1}^{n}(x_{i}-{\overline {x}}_{n})^{2}}}

.

Mise en place du test

On rappelle que l'on veut tester $H 0 : μ = μ 0$ . On choisit un risque $α$ , généralement 0,05 ou 0,01^{[réf. nécessaire]}. Le risque α s'appelle risque de première espèce, c'est la probabilité de rejeter $H_{0}$ dans le cas où $H_{0}$ est vraie. La figure ci-contre correspond à un risque $\alpha$ de 0,1 et $n=8$ , et donc une loi de Student avec $n-1=7$ degrés de liberté. La figure montre le quantile d'ordre $\alpha \over 2$ (à gauche) et celui d'ordre $1-{\frac {\alpha }{2}}$ (à droite). Comme la loi de Student est symétrique, ces quantiles sont égaux au signe près.

Si la valeur de $z$ (sur l'axe des abscisses) est dans la zone bleue (entre les deux quantiles), alors on conserve l'hypothèse nulle.
Si elle est dans la zone rouge, on rejette l'hypothèse nulle.

Dit autrement, si $| z |$ est supérieur au quantile d'ordre $1 - α / 2$ de la loi de Student à $n - 1$ degrés de liberté alors on rejette l'hypothèse nulle.

Variantes

Examinons la variante où cherche à tester l'hypothèse nulle $H 0 : μ \leq μ 0$ . Dans ce cas, une valeur de $z$ négative n'est pas discriminante et si $z$ est dans la région bleue de la figure ci-contre alors on conserve l'hypothèse nulle. Par contre, si $z$ est supérieur au quantile d'ordre $1 - α$ de la loi de Student à $n - 1$ degrés de liberté alors on rejette l'hypothèse nulle (région rouge à droite pour un risque de $\alpha$ = 10%).

Tester $H 0 : μ \geq μ 0$ se fait de manière symétrique. Cette fois ci, des valeurs positives de $z$ ne sont pas discrimantes. Si $z$ est inférieur au quantile d'ordre $α$ de la loi de Student à $n - 1$ degrés de liberté (région rouge à gauche pour un risque de $\alpha$ = 10% dans la figure) alors on rejette l'hypothèse nulle.

Implémentation


Langage/Logiciel	Fonction	Notes
R	t.test	[1]
SAS	PROC TTEST	[2]
Python	scipy.stats.ttest_ind	[3]
Matlab	ttest	[4]
Mathematica	TTEST	[5]
Stata	ttest	[6]
Julia	OneSampleTTest EqualVarianceTTest	[7]
Maple	OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest	^[5]

Notes et références

↑ Bernard Ycart, « Tests statistiques », Cahier de Mathématiques Appliquées, n^o 6,‎ 2002 (lire en ligne [PDF])
↑ Gaël Millot, Comprendre et réaliser les tests statistiques à l'aide de R : manuel de biostatistique, dl 2018 (ISBN 978-2-8073-0291-4 et 2-8073-0291-2, OCLC 1023590131, lire en ligne)
↑ (en) "Student" William Sealy Gosset, « The probable error of a mean », Biometrika, vol. 6, n^o 1,‎ 1908, p. 1–25 (DOI 10.1093/biomet/6.1.1)
↑ Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans (en) S. L. Zabell, « On Student's 1908 paper "The probable error of the mean" », Journal of the American Statistical Association, vol. 103,‎ 2008, p. 1-7 (DOI 10.1198/016214508000000030, JSTOR 27640017)
↑ « Student's t-Test - Maple Help », sur www.maplesoft.com (consulté le 28 mai 2023)

Voir aussi

Loi de Student, la loi de probabilité de la statistique dans le test t
Test t de Welch, une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
Test de Wald

Portail des probabilités et de la statistique

[1] Bernard Ycart, « Tests statistiques », Cahier de Mathématiques Appliquées, n^o 6,‎ 2002 (lire en ligne [PDF])

[2] Gaël Millot, Comprendre et réaliser les tests statistiques à l'aide de R : manuel de biostatistique, dl 2018 (ISBN 978-2-8073-0291-4 et 2-8073-0291-2, OCLC 1023590131, lire en ligne)

[3] (en) "Student" William Sealy Gosset, « The probable error of a mean », Biometrika, vol. 6, n^o 1,‎ 1908, p. 1–25 (DOI 10.1093/biomet/6.1.1)

[4] Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans (en) S. L. Zabell, « On Student's 1908 paper "The probable error of the mean" », Journal of the American Statistical Association, vol. 103,‎ 2008, p. 1-7 (DOI 10.1198/016214508000000030, JSTOR 27640017)

[5] « Student's t-Test - Maple Help », sur www.maplesoft.com (consulté le 28 mai 2023)

[1]

[2]

[3]

[4]

[5]