Moyenne géométrique

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La moyenne géométrique de deux nombres a et b est un nombre c tel que :

\frac ac=\frac cb.

Géométriquement, ce nombre c est l'arête d'un carré dont la surface est la même que celle du rectangle de côtés a et b, puisque dans ce cas :

c^2=ab.

On peut calculer directement la moyenne géométrique de deux nombres en prenant la racine carrée de l'expression précédente :

c = \sqrt{ab} = (ab)^{1/2}.

Sous cette dernière forme, on voit que le logarithme (en base quelconque) transforme l'expression en une moyenne arithmétique. D'où la généralisation : la moyenne géométrique d'une série statistique quantitative discrète positive non nulle est définie telle que son logarithme est la moyenne arithmétique des logarithmes des valeurs discrètes positives non nulles de la distribution.

Sa formulation peut se faire comme suit :

\log\bar x=\frac{\log x_1+\log x_2+\ldots+\log x_n}n={1\over n}\sum_{i=1}^n\log x_i.

On en déduit :

\bar x= \sqrt[n]{x_1 \times x_2 \times\ldots\times x_n} = \sqrt[n]{\prod_{i = 1}^n{x_i}}.

Pour une série statistique dont le nombre total d’occurrences est infini ou inconnu, mais dont le nombre de valeurs positives non nulles possibles est fini et leurs fréquences respectives dans la série sont connues, la formulation mathématique devient :

\log\bar x=f_1\log x_1+f_2\log x_2+\ldots+f_n\log x_n=\sum_{i=1}^n{f_i\log x_i}, où \sum_{i=1}^n{f_i}=1.

On en déduit (en utilisant par exemple le logarithme naturel) :

\bar x=\exp(f_1\ln x_1+f_2\ln x_2+\ldots+f_n\ln x_n)=\exp\left(\sum_{i=1}^nf_i\ln x_i\right),

d’où :

\bar x={x_1}^{f_1} \times {x_2}^{f_2} \times\ldots\times {x_n}^{f_n} = \prod_{i = 1}^n{{x_i}^{f_i}}.

La moyenne géométrique d'une distribution f d'une variable continue à valeur dans un intervalle scalaire fini [x0, x1] est la généralisation à la limite de la formule statistique discrète précédente :

\log{\bar f_{x_0}^{x_1}} = \int_{x_0}^{x_1}{\log xf(x)~\mathrm dx},

d’où :

\bar f_{x_0}^{x_1}=\exp\left(\int_{x_0}^{x_1}\ln xf(x)~\mathrm dx\right), où \int_{x_0}^{x_1}f(x)~\mathrm dx=1.

Sa dimension n'est pas une fréquence, mais est celle de sa variable continue.

Si la distribution f est définie sur toutes les valeurs réelles de sa variable continue, la moyenne géométrique de la distribution est :

\bar f=\exp\left(\int_{-\infin}^{+\infin}\ln xf(x)~\mathrm dx\right), où \int_{-\infin}^{+\infin}f(x)~\mathrm dx=1.

Intérêt[modifier | modifier le code]

Pour les statisticiens, la moyenne géométrique (antilogarithme de la moyenne des logarithmes de chacune des observations) est moins sensible que la moyenne arithmétique aux valeurs les plus élevées d'une série de données. Elle donne, par conséquent, une autre et meilleure estimation de la tendance centrale des données dans le cas d’une distribution à longue traîne à l’extrémité supérieure de la courbe (type de distribution fréquente dans les mesures sanitaires ou environnementales par exemple de toxiques dans l'organisme le sang ou l'environnement, où certains individus ou groupes vulnérables ou exposés à des cas particuliers sont plus affectés).

Voir aussi[modifier | modifier le code]