Mode (statistiques)

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 25 avril 2019 à 04:01 et modifiée en dernier par JackBot (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

En statistique, le mode, ou valeur dominante, est la valeur la plus représentée d'une variable quelconque dans une population donnée. Une répartition peut être unimodale ou plurimodale (bimodale, trimodale…), si deux ou plusieurs valeurs de la variable considérée émergent également, voire sans aucun mode (distribution uniforme) si toutes les valeurs de la variable considérée émergent également.

Dans le cas d'une répartition en classes d'amplitudes égales, la classe modale désigne celle qui a le plus fort effectif. La convention est d'appeler mode le centre de la classe modale. Si les classes sont d'amplitudes diverses, il convient de relativiser pour désigner ce paramètre. La classe modale est alors celle qui a la plus forte densité.

Dans le domaine des probabilités, le mode d'une variable aléatoire X est la valeur la plus vraisemblable. C'est le maximum de pour les variables aléatoire de loi de probabilité discrète ou le maximum de la densité f(x) pour les variable de loi de probabilité absolument continue[1].

Le mode xm est tel que p(xm) ≥ p(x) ou f(xm) ≥ f(x) pour tout xxm tous deux dans le support de la loi.

Comparaison entre moyenne, médiane et mode

Visualisation du mode, de la médiane et de la moyenne d'une densité de probabilité[2].
Comparaison des valeurs moyennes d'un échantillon { 1, 2, 2, 3, 4, 7, 9 }
Type Description Exemple Résultat
Moyenne arithmétique Somme des valeurs de l'échantillon divisée par le nombre de valeurs : (1+2+2+3+4+7+9) / 7 4
Médiane (statistiques) Valeur ayant autant de valeurs supérieures et que d'inférieures 1, 2, 2, 3, 4, 7, 9 3
Mode Valeur la plus représentée dans l'ensemble 1, 2, 2, 3, 4, 7, 9 2

Utilisation

Le concept de mode peut s'appliquer à un ensemble de données nominales, contrairement à la médiane ou la moyenne : on peut déterminer le mot le plus représenté dans un texte. Le mode permet ainsi de déterminer la classe la plus représentée dans un sondage ou le vainqueur d'un vote pour une distribution unimodale.

Détermination et unicité

Pour un ensemble fini, l'existence de la moyenne, de la médiane et du mode est toujours vérifiée, mais seul le mode ne sera pas nécessairement unique.

Certaines distributions n'ont aucun mode (comme la loi de Cantor).

Propriétés

Dans les cas où les trois valeurs existent et sont uniques, elles vérifient :

  • Si l'échantillon subit une transformation affine X → aX + b, la moyenne, la médiane et le mode suivent la même transformation.
  • Le mode est très peu sensible aux donnés parasites (sauf pour des échantillons de tailles très réduite), comme la médiane. La moyenne est connue pour sa sensibilité.
  • Il n'y a aucune règle précise sur l'ordre des valeurs pour une distribution continue unimodale quelconque. Cependant, dans les cas d'une distribution non symétrique proche d'une loi normale, Karl Pearson remarque qu'on peut faire l'approximation « médiane ≈ (2 × moyenne + mode)/3 »[3],[4]
  • Pour une loi unimodale d'écart-type σ, la différence entre la moyenne et le mode vaut au maximum ±3σ[5]

Références

  1. Bogaert 2006, p. 86
  2. « AP Statistics Review - Density Curves and the Normal Distributions » (consulté le )
  3. « Relationship between the mean, median, mode, and standard deviation in a unimodal distribution »
  4. Paul T. von Hippel, « Mean, Median, and Skew: Correcting a Textbook Rule », Journal of Statistics Education, vol. 13, no 2,‎ (DOI 10.1080/10691898.2005.11910556, lire en ligne)
  5. Modèle:Cite paper

Bibliographie

Voir aussi