Variance (statistiques et probabilités)
En théorie des probabilités et en statistique, la variance est une mesure servant à caractériser la dispersion d'une distribution ou d'un échantillon. C'est un des moments caractéristiques d'une distribution qui peut être interprété comme un moment d'inertie.
Sommaire |
Définition [modifier]
Soit X une variable aléatoire réelle dont le moment d'ordre 2, à savoir
, existe. On définit la variance par
[b 1]
étant l'espérance mathématique ; l'existence du moment d'ordre 2 implique celle de
.
On peut interpréter la variance comme la moyenne des carrés des écarts à la moyenne (rigoureusement : l'espérance des carrés des écarts à l'espérance, informellement : moyenne des carrés moins le carré de la moyenne). Elle permet de caractériser la dispersion des valeurs par rapport à la moyenne. Ainsi, une distribution avec une même espérance et une variance plus grande apparaîtra comme plus étalée. Le fait que l'on prenne le carré de ces écarts à la moyenne évite que des écarts positifs et négatifs ne s'annulent. On note souvent la variance d'une distribution par
et celle d'un échantillon par S2[b 2].
Histoire [modifier]
Ronald Fisher employa, le premier, le mot de variance, dans un article de 1918 intitulé « The Correlation between Relatives on the Supposition of Mendelian Inheritance » [i 1] où il définit la variance comme le carré de l'écart type. Dans ce document il préfère clairement la variance à l'écart type en tant que mesure de la variabilité d'un phénomène observé. Il utilise ce terme à nouveau au congrès de mathématiques de Toronto en 1924[i 2]. C'est lui qui définit aussi l'analyse de la variance telle qu'on la pratique aujourd'hui dans son livre « Statistical methods for research workers » paru en 1925[i 3],[b 2].
Propriétés [modifier]
La variance est toujours positive ou nulle. Lorsque la variance est nulle, cela signifie que la variable aléatoire correspond à une constante (toutes les réalisations sont identiques). Une formule alternative de calcul de la variance est déduite de la définition :
[b 1]Cette formule stipule que la variance est égale à l'espérance du carré de X moins le carré de l'espérance de X. La formule permet souvent un calcul plus simple de la variance que la définition. Sa démonstration est faite dans le théorème de König-Huyghens. La variance d'une transformation affine est égale à
[Note 1],[b 3]On remarque à travers cette propriété que le fait de déplacer simplement une distribution (ajouter +b) ne modifie pas sa variance. Par contre, changer l'échelle (multiplier par a) modifie la variance quadratiquement. Cette propriété permet également de confirmer la remarque établie précédemment que la variance d'une constante est nulle, en effet,ic,
.
La variance de la somme de deux variables aléatoires est calculée ainsi : Si
désigne la covariance des variables aléatoires
et
, alors:
[b 4]Grâce aux deux propriétés précédentes, on obtient immédiatement la généralisation suivante :
La variance de la somme de deux variables indépendantes (et plus généralement non corrélées) vaut donc
mais la réciproque est fausse[b 4]. Il faut faire attention au fait que
! Même si les variables sont soustraites, leurs variances s'additionnent.
La covariance est une forme bilinéaire symétrique positive sur l'espace vectoriel
des variables aléatoires de carré intégrable, et la forme quadratique associée est la variance. Ce qui permet de généraliser le cas de deux variables à celui-ci:
[b 5]De plus,
[b 5] 
Si
est une suite de variables aléatoires indépendantes et de même variance
et si
est la moyenne de ces variables alors,
[Note 2],[b 6]
La variance d'un produit de deux variables aléatoires indépendantes X et Y de variances finies est exprimée en fonction de celles des deux variables par la formule
[b 4]Écart type [modifier]
L'écart type est la racine carrée de la variance.
[b 7]Son atout est qu'il est de même dimension que la variable aléatoire.
Si
est une suite de variables aléatoires
[Note 3].L'égalité intervient si et seulement si toutes les variables sont identiques à un coefficient multiplicatif positif près.
Cas discret [modifier]
La variance V(X) représente la moyenne des carrés des écarts à la moyenne : elle permet de caractériser, tout comme l'écart type, la dispersion des valeurs
par rapport à la moyenne, notée
ou encore E(X).
Soit une série statistique
de moyenne
et d'effectif total n (c’est-à-dire
et
).
La variance de cette série est alors :
Simplification [modifier]
La moyenne peut être considérée comme le barycentre de la série.
D'après le théorème de König, on a : 
Or,
et
donc on a :
Équiprobabilité [modifier]
Dans le cas d'équiprobabilité,
Cas continu [modifier]
Dans le cas continu, la variance se calcule de la façon suivante :
Variance d'un vecteur aléatoire [modifier]
Si l'on définit
comme un vecteur aléatoire qui comporte k variables et
comme le vecteur des k espérances de X, on définit alors la variance comme:
Définition — ![\Sigma_{k\times k} \equiv \operatorname{Var}[X_{k\times 1}]\equiv \mathbb{E}\left[(X_{k\times 1}-\Mu)(X_{k\times 1}-\Mu)'\right]](http://upload.wikimedia.org/math/7/7/7/777f84e8a438a694a323da52ad7a31fb.png)
Il s'agit alors d'une matrice carrée de taille k, appelée matrice de variance-covariance, qui comporte sur sa diagonale les variances de chaque composante du vecteur aléatoire et en dehors de la diagonale les covariances. Cette matrice est symétrique et semi-définie positive ; elle est définie positive si et seulement si la seule combinaison linéaire certaine (c'est-à-dire presque sûrement constante) des composantes du vecteur aléatoire est celle dont tous les coefficients sont nuls.
On a les propriétés suivantes:
Propriété — Si V est une matrice carrée de taille ![k, \operatorname{Var}[V_{k\times k}X_{k\times 1}]=V\operatorname{Var}[X]V'](http://upload.wikimedia.org/math/a/6/8/a6836ce4dd9660a838d444ccdce61be1.png)
Estimation [modifier]
Deux estimateurs sont généralement utilisés pour la variance:
et
Propriétés [modifier]
Biais [modifier]
- L'estimateur
est biaisé: 
L'estimateur
est:
.
La deuxième égalité s'obtient d'après le théorème de König-Huyghens.
Nous allons calculer l'espérance de l'estimateur d'après la deuxième formule:
.
Il faut donc étudier l'espérance des deux termes, on verra que:
.
On a supposé que tous les réalisations ont la même espérance:
En appliquant de nouveau la formule de König-Huyghens:
.
Etudions au préalable l'espérance et la variance de la moyenne:
- La moyenne
de l'échantillon est une variable aléatoire (si on change les individus alors
varie):
- -d'espérance

- -de variance:
(la moyenne de n variables aléatoires fluctue moins qu'une seule variable aléatoire)
- -d'espérance
En appliquant de nouveau la formule de König-Huyghens:
.
On a donc
.
- La variance s de l'échantillon fluctue donc autour de
et non autour de V(X) comme on aurait pu s'y attendre.
- L'estimateur
est sans biais.
Démonstration — En effet, il suffit de corriger l'estimateur
en le multipliant par
pour avoir un estimateur sans biais: ![E\left[\frac{n}{n-1} s^2_{n}\right]= \frac{n}{n-1} E[s^2_{n}]=\frac{n}{n-1} \frac{n-1}{n}\sigma^2=\sigma^2](http://upload.wikimedia.org/math/8/e/5/8e50ebdefd648d0d1d0b4e10c15b9788.png)
Pourquoi n-1 ? [modifier]
Le fait que l'estimateur de la variance doive être divisé par n-1 (et donc dans un certain sens moins précis) pour être sans biais provient du fait que l'estimation de la variance implique l'estimation d'un paramètre en plus, l'espérance. Cette correction tient donc compte du fait que l'estimation de l'espérance induit une incertitude de plus. En effet:
Théorème — si l'on suppose que l'espérance est connue, l'estimateur
est sans biais
en reprenant la démonstration du biais de
lorsque l'espérance est inconnue, on avait montré que:
. Puis calculé que:
Cependant, le deuxième calcul est désormais différent:
étant connu, on pose que
et on a: ![E[\mu^2]=E[\mu]^2](http://upload.wikimedia.org/math/a/2/7/a278451e804a1414dc7e28d22f4ae1ae.png)
Donc on a directement:
.
La formule devient alors: 
Convergence [modifier]
Les estimateurs
et
sont convergents en probabilité.
Théorème —
et
si les observations sont iid
.
Réecrivons l'estimateur:

Et étudions la convergence des termes séparément:
par le théorème de Slutsky.
par la loi des grands nombres.
Alors 
Comme ce résultat est asymptotique, il s'applique également à
, qui est asymptotiquement équivalent à 
Distribution des estimateurs [modifier]
En tant que fonction de variables aléatoires, l'estimateur de la variance est également une variable aléatoire. Sous l'hypothèse que les
sont des observations indépendantes d'une loi normale, le théorème de Cochran (en) montre que
suit une loi du χ²:
En conséquence, il suit que
. Cette propriété d'absence de biais peut cependant être démontrée même sans l'hypothèse de normalité des observations.
Méthodes de calcul [modifier]
Le calcul par ordinateur de la variance empirique peut poser certains problèmes, notamment à cause de la somme des carrés. La page anglaise: Algorithms for calculating variance décrit le problème ainsi que des algorithmes proposés.
Notes et références [modifier]
Notes [modifier]
- Pour cette démonstration, il est utile de rappeler une des propriétés de l'espérance:
. On a alors ![\scriptstyle \operatorname{Var}(aX+b) = E[(aX+b -E[aX+b])^2] = E[(aX+b -aE[X]-b)^2] = E[(aX -aE[X])^2] = E[a^2(X -E[X])^2] = a^2E[(X -E[X])^2] = a^2\operatorname{Var}(X)](//upload.wikimedia.org/math/9/3/5/935de240bedf4196b21221fc0ba7e7cf.png)
-

- En partant de la bilinéarité
et en utilisant
, il vient
. Il y a égalité si et seulement si
pour tout couple.
Références [modifier]
Ouvrages spécialisés [modifier]
- Saporta 2006, p. 25
- Dodge 2010, p. 556
- Rioul 2008, p. 142
- Saporta 2006, p. 26
- Rioul 2008, p. 183-185
- Dodge 2010, p. 508
- Dodge 2010, p. 506
Articles publiés sur internet [modifier]
- [PDF] (en) Ronald A. Fisher, « The Correlation between Relatives on the Supposition of Mendelian Inheritance. », Philosophical Transactions of the Royal Society of Edinburgh., vol. 52, 1918, p. 399–433 [texte intégral (page consultée le 25 avril 2012)]
- [PDF] Jean-Paul Benzécri, « Histoire et Préhistoire de l'Analyse des données : Partie 3 », Les Cahiers de l'analyse des données, vol. 1, no 3, 1976, p. 221-241 [texte intégral (page consultée le 24 avril 2012)]
- [PDF] J.M. Faverge, « III. - L'analyse de la variance en psychologie. », L'année psychologique., vol. 49, no 1, 1948, p. 341-358 [texte intégral (page consultée le 24 avril 2012)]
Voir aussi [modifier]
Bibliographie [modifier]
- (fr) Gilbert Saporta, Probabilités, Analyse des données et Statistiques, Paris, Éditions Technip, 2006, 622 p. (ISBN 978-2-7108-0814-5) [lire en ligne] [détail des éditions].

- (fr) Olivier Rioul, Théorie des probabilités, Paris, Editions Hermes sciences, 2008, 364 p. (ISBN 978-2-7462-1720-1).

- (en) Yadolah Dodge, « The Concise Encyclopaedia of Statistics », New York, Springer, 2010, 622 p. (ISBN 978-0-387-31742-7).

Articles connexes [modifier]
Lien externe [modifier]
- Eric W. Weisstein, « Variance », MathWorld--A Wolfram Web Resource. Consulté le 25 Avril 2012
- Calcul en ligne de la variance, Calculis
étant l'
.










.

de l'échantillon est une variable aléatoire (si on change les individus alors 
(la moyenne de n variables aléatoires fluctue moins qu'une seule variable aléatoire)
et non autour de V(X) comme on aurait pu s'y attendre.
par le
par la 
. On a alors ![\scriptstyle \operatorname{Var}(aX+b) = E[(aX+b -E[aX+b])^2] = E[(aX+b -aE[X]-b)^2] = E[(aX -aE[X])^2] = E[a^2(X -E[X])^2] = a^2E[(X -E[X])^2] = a^2\operatorname{Var}(X)](http://upload.wikimedia.org/math/9/3/5/935de240bedf4196b21221fc0ba7e7cf.png)

et en utilisant
, il vient
. Il y a égalité si et seulement si
pour tout couple.