Kurtosis
En théorie des probabilités et en statistique, le kurtosis (du grec κυρτός : courbe, arrondi, bossu), plus souvent traduit par coefficient d’aplatissement ou coefficient d’aplatissement de Pearson, correspond à une mesure de l’aplatissement, ou a contrario de la pointicité, de la distribution d’une variable aléatoire réelle. C’est le deuxième des paramètres de forme, avec le coefficient de dissymétrie (les paramètres basés sur les moments d’ordre 5 et plus n’ont pas de nom attribué). Il mesure, hors effet de dispersion (donnée par l’écart type), la disposition des masses de probabilité autour de leur centre, tel que donné par l’espérance mathématique, c’est-à-dire, d’une certaine façon, leur regroupement proche ou loin du centre de probabilité.
Sommaire |
Définitions [modifier]
Kurtosis non normalisé (coefficient d’aplatissement) [modifier]
Étant donnée une variable aléatoire réelle
d’espérance
et d’écart type
, on définit son kurtosis non normalisé comme le moment d’ordre quatre de la variable centrée réduite :
lorsque cette espérance existe. On a donc :
avec
les moments centrés d’ordre
.
Kurtosis normalisé (excès d’aplatissement) [modifier]
Le kurtosis non normalisé étant défini en termes de moments centrés, il est malaisé à manipuler lorsqu’il s’agit de calculer celui de la somme de variables indépendantes.
On définit ainsi le kurtosis normalisé en termes de cumulants :
Sachant que
et
[1], on a alors :
Propriétés [modifier]
Dimension [modifier]
Les moments centrés
et cumulants
ayant pour dimension celle de la variable
élevée à la puissance
, les kurtosis
et
sont des grandeurs adimensionnelles.
Plage de valeur [modifier]
Soit la variable aléatoire réelle
. Cette variable aléatoire a pour espérance
et pour variance
. Sachant que
, on en déduit alors que :
Cette limite inférieure n’est atteinte que dans le cas de la loi de Bernoulli de paramètre
(un seul tirage à pile ou face avec une pièce parfaitement équilibrée). Pour la loi normale, on a
.
Le kurtosis n’a pas de limite supérieure.
Somme de réalisations indépendantes [modifier]
Soient
une variable aléatoire réelle et
la somme de
réalisations indépendantes de
(exemple : la loi binomiale de paramètres
et
, somme de
réalisations indépendantes de la loi de Bernoulli de paramètre
). Grâce à la propriété d’additivité des cumulants, on sait que
, donc :
Typologie [modifier]
Un coefficient d’aplatissement élevé indique que la distribution est plutôt pointue en sa moyenne, et a des queues de distribution épaisses (fat tails en anglais, fat tail au singulier). Cela se déduit en considérant la distribution
définie plus haut, dont l’espérance vaut 1 et dont le moment centré d’ordre deux est le kurtosis non normalisé de
. Comme son espérance est fixée, son moment d’ordre deux ne peut évoluer que par compensation : pour l’augmenter, il faut de l’inertie en position éloignée, contrebalancée par de l’inertie proche. En d’autres termes, on « pince » les flancs et les probabilités se déplacent par conséquent vers le centre et les extrémités.
Le terme d'« excès d’aplatissement », dérivé de kurtosis excess en anglais, utilisé pour le kurtosis normalisé peut être source d’ambiguïté. En effet, un excès d’aplatissement positif correspond à une distribution pointue et un excès d’aplatissement négatif à une distribution aplatie (on s’attendrait à l’inverse).
Distribution mésokurtique [modifier]
Si
, on parle de distribution mésokurtique (ou mésocurtique). La loi normale est un cas particulier de distribution mésokurtique pour laquelle le coefficient de dissymétrie
vaut 0.
Distribution leptokurtique [modifier]
Si
, on parle de distribution leptokurtique (ou leptocurtique). La notion de leptokurticité est très utilisée dans le milieu de la finance de marché, les échantillons ayant des queues plus épaisses que la normale aux extrémités, impliquant des valeurs anormales plus fréquentes[2].
Distribution platikurtique [modifier]
Si
, on parle de distribution platykurtique (ou platycurtique, platikurtique, platicurtique). Pour une même variance, la distribution est relativement « aplatie », son centre et ses queues étant appauvries au profit des flancs.
Exemples de kurtosis pour quelques distributions absolument continues [modifier]
La figure suivante représente quelques distributions à densité unimodales centrées réduites symétriques (
,
et
).
| Loi de probabilité | Kurtosis normalisé | Symbole dans la figure | Couleur dans la figure |
|---|---|---|---|
| Loi de Laplace | 3 | D | Courbe rouge |
| Loi sécante hyperbolique | 2 | S | Courbe orange |
| Loi logistique | 1,2 | L | Courbe verte |
| Loi normale | 0 | N | Courbe noire |
| Loi du cosinus surélevé | -0,593762… | C | Courbe cyan |
| Loi du demi-cercle | -1 | W | Courbe bleue |
| Loi uniforme continue | -1,2 | U | Courbe magenta |
Estimateur non biaisé [modifier]
Une utilisation naïve des définitions théoriques
et
du coefficient d’aplatissement entraîne des mesures biaisées. Plusieurs logiciels de statistiques (SAS, Tanagra, Minitab, PSPP/SPSS et Excel par exemple, mais pas BMDP) utilisent un estimateur non biaisé pour la loi normale du kurtosis normalisé :
où
et
sont des estimateurs non biaisés respectivement de l’espérance et de la variance.
Voir aussi [modifier]
Notes et références [modifier]
- Voir Cumulants (statistiques)#Cumulants et moments.
- Régis Bourbonnais et Michel Terraza, Analyse des séries temporelles, 2e édition, Dunod, 2008, p. 296
![\beta_2 = \mathbb{E} \left[ \left( \frac{X - \mu}{\sigma} \right)^4 \right]](http://upload.wikimedia.org/math/2/4/f/24f22f5f25511669a8924885ac8bb674.png)






