Boîte à moustaches

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Dans les représentations graphiques de données statistiques, la boîte à moustaches (aussi appelée diagramme en boîte, boîte de Tukey ou box plot) est un moyen rapide de figurer le profil essentiel d'une série statistique quantitative. Elle a été inventée en 1977 par John Tukey, mais peut faire l'objet de certains aménagements selon les utilisateurs. Son nom est la traduction de Box and Whiskers Plot.

Principe[modifier | modifier le code]

La boîte à moustaches résume seulement quelques caractéristiques de position du caractère étudié (médiane, quartiles, minimum, maximum ou déciles). Ce diagramme est utilisé principalement pour comparer un même caractère dans deux populations de tailles différentes.

Il s'agit de tracer un rectangle allant du premier quartile au troisième quartile et coupé par la médiane. Ce rectangle suffit pour le diagramme en boîte. On ajoute alors des segments aux extrémités menant jusqu'aux valeurs extrêmes, ou jusqu'aux premier et neuvième déciles (D_1/D_9), voire aux 5e et 95e centiles. On parle alors de diagramme en boîte à moustaches ou de diagramme à pattes.

Boite a moustaches.png

Comparaison de deux diagrammes en boîte à moustaches D_1/D_9 avec
- pour la boîte inférieure : Q1 = 3, M = 7, Q3=12, D_1 = 1,  D_9 = 16
- pour la boîte supérieure : Q1 = 7, M = 9, Q3=12, D_1 = 1,  D_9 = 16

Historique[modifier | modifier le code]

Dans les diagrammes en boîte de Tukey, la longueur des « moustaches » vaut 1,5 fois l’écart interquartile. Ces diagrammes de Tukey étaient utilisés dans des secteurs où les données peuvent le plus souvent être modélisées en utilisant une loi normale ; dans ce cas, la théorie montre que les extrémités des « moustaches » sont voisines du premier et 99e centile : ces diagrammes étaient surtout utilisés pour détecter la présence de données exceptionnelles.

On les y désigne aussi sous les vocables de boîtes à pattes ou Box Plot.