Utilisateur:Doubleclavier/Brouillon2
En statistique
[modifier | modifier le code]Pour une population finie le calcul de l'écart type est purement algébrique, sans référence aux probabilités, et le statisticien emploie l'écart type empirique défini par [b 1].
Lorsqu'il n'est pas possible de connaître toutes les valeurs de la caractéristique considérée, on se trouve dans le cadre de la théorie statistique. Le statisticien procède alors par échantillonnage et estimation pour évaluer les grandeurs analysées telles que l'écart type.
Estimateurs
[modifier | modifier le code]Un estimateur est une fonction permettant d'approcher un paramètre d'une population à l'aide d'un échantillon tiré au hasard[b 2], ou une grandeur sur un phénomène aléatoire à partir de plusieurs réalisations de celui-ci.
Dans le cas d'un échantillon de taille , et dont la vraie moyenne -ou espérance- est connue, l'estimateur est le suivant:Malheureusement, le plus souvent on ne connaît pas μ et on doit l'estimer à partir de l'échantillon lui-même grâce à l'estimateur suivant : . Différents estimateurs de l'écart type sont généralement utilisés. La plus part de ces estimateurs s'expriment par la formule : (ou S′ ) est l'estimateur le plus utilisé[b 3],[b 1], mais certains auteurs recommandent d'utiliser (ou S )[i 1].
Propriétés des estimateurs
[modifier | modifier le code]Article détaillé : Qualités d'un estimateur.
Deux propriétés importantes des estimateurs sont la convergence et l'absence de biais[b 1].
Pour tout tel que tende vers , la loi des grands nombre garantis que puis sont des estimateur convergents de . Grâce au théorème de continuité, stipulant que si f est continue . La fonction racine carrée étant continue, converge lui aussi vers . En particulier et sont des estimateurs convergents de , ce qui reflète l'approximation de par ces deux séries lorsque n devient de plus en plus grand[Note 1],[b 4] et conforte le statisticien à utiliser ces estimateurs.
L'estimateur de la variance est sans biais. Cependant, la non linéarité de la fonction racine carrée fait que est légèrement biaisé[i 1]. Les estimateurs et sont eux aussi biaisés. Le fait de faire intervenir non pas n mais n-1 au dénominateur (correction de Bessel) dans le calcul de la variance vient du fait que déterminer la moyenne de x à partir de l'échantillon fait perdre un degré de liberté puisque la formule relie aux valeurs xi. On a donc seulement n-1 valeurs indépendantes après le calcul de . Dans le cas ou l'on cherche à estimer l’écart-type d'une loi normale, on dispose d'un estimateur non biaisé de proche de [i 2]. Le choix de permet de corriger le biais supplémentaire lié à la racine carrée.
La précision, donnée par l'erreur quadratique moyenne, est difficile à calculer explicitement pour des lois quelconques. Il semblerait cependant qu'en dépit d'un biais plus important, soit plus précis que [i 1].
Notes et références
[modifier | modifier le code]Notes
[modifier | modifier le code]- D'après le théorème de continuité on a :
Théorème — Si g est continue, alors :
Références
[modifier | modifier le code]Ouvrages spécialisés
[modifier | modifier le code]- Saporta 2006, p. 279-280
- Saporta 2006, p. 289
- Tufféry 2010, p. 655
- Rioul 2008, p. 253
Articles de revue
[modifier | modifier le code]- [PDF]Emmanuel Grenier, « Quelle est la « bonne » formule de l’écart-type ? », La revue MODULAD, no 37, (lire en ligne, consulté le )
- Richard M. Brugger, « A Note on Unbiased Estimation of the Standard Deviation », The American Statistician, vol. 23, no 4, , p. 32–32 (ISSN 0003-1305, DOI 10.1080/00031305.1969.10481865, lire en ligne, consulté le )