Asymétrie (statistiques)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Asymétrie.

En théorie des probabilités et statistique, le coefficient de dissymétrie (skewness en anglais) correspond à une mesure de l’asymétrie de la distribution d’une variable aléatoire réelle. C’est le premier des paramètres de forme, avec le kurtosis (les paramètres basés sur les moments d’ordre 5 et plus n’ont pas de nom attribué). En termes généraux, l’asymétrie d’une distribution est positive si la queue de droite (à valeurs hautes) est plus longue ou grosse, et négative si la queue de gauche (à valeurs basses) est plus longue ou grosse.

Définition[modifier | modifier le code]

Étant donnée une variable aléatoire réelle X d’espérance \mu et d’écart type \sigma, on définit son coefficient d’asymétrie comme le moment d’ordre trois de la variable centrée réduite :

\gamma_1 = \mathbb{E} \left[ \left( \frac{X - \mu}{\sigma} \right)^3 \right]

lorsque cette espérance existe. On a donc :

\gamma_1 = \frac{\mu_3}{\mu_2^{\ 3/2}} = \frac{\kappa_3}{\kappa_2^{\ 3/2}}

avec \mu_i les moments centrés d’ordre i et \kappa_i les cumulants d’ordre i.

Propriétés[modifier | modifier le code]

Dimension[modifier | modifier le code]

Les moments centrés \mu_i et cumulants \kappa_i ayant pour dimension celle de la variable X élevée à la puissance i, le coefficient d’asymétrie \gamma_1 est une grandeur adimensionnelle.

Somme de réalisations indépendantes[modifier | modifier le code]

Soient X une variable aléatoire réelle et Y = \sum_{k=1}^n X la somme de n réalisations indépendantes de X (exemple : la loi binomiale de paramètres n et p, somme de n réalisations indépendantes de la loi de Bernoulli de paramètre p). Grâce à la propriété d’additivité des cumulants, on sait que \kappa_i(Y) = n \kappa_i(X), donc :

\gamma_1(Y) = \frac{n \kappa_3(X)}{(n \kappa_2(X))^{3/2}} = \frac{\gamma_1(X)}{\sqrt{n}}

Forme de la distribution[modifier | modifier le code]

  • Un coefficient positif indique une distribution décalée à gauche de la médiane, et donc une queue de distribution étalée vers la droite.
  • Un coefficient négatif indique une distribution décalée à droite de la médiane, et donc une queue de distribution étalée vers la gauche.
  • Un coefficient nul indique une distribution symétrique : c’est par exemple le cas de la loi normale.
  • Negative and positive skew diagrams (English).svg

Estimateur non biaisé[modifier | modifier le code]

Une utilisation naïve de la définition théorique \gamma_1 du coefficient d’asymétrie entraîne une mesure biaisée. Un estimateur non biaisé pour la loi normale de l’asymétrie est :

G_1 = \frac{n^2}{(n-1) (n-2)} \frac{\sum_{i=1}^n (x_i - \hat{\bar{x}})^3}{\hat{\sigma^2}^{3/2}}

\hat{\bar{x}} et \hat{\sigma^2} sont des estimateurs non biaisés respectivement de l’espérance et de la variance.

Voir aussi[modifier | modifier le code]

Notes et références[modifier | modifier le code]


Articles connexes[modifier | modifier le code]