Moment (mathématiques)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Moment.

En théorie des probabilités et en statistique, le moment d’ordre r ∈ ℕ d’une variable aléatoire réelle X est un indicateur de la dispersion de cette variable, à l’instar par exemple de son écart type, la racine carrée du moment centré d’ordre 2.

Le moment dit « ordinaire » d’ordre r ∈ ℕ est défini, s’il existe, par :

m_r \triangleq \mathbb{E}(X^r)

De manière analogue, on définira d’autres moments, étudiés ou évoqués dans la suite de l’article.

Notion de moment en analyse[modifier | modifier le code]

La notion de moment en mathématiques, notamment en théorie des probabilités, a pour origine la notion de moment en physique.

Soit une fonction f : I → ℝ continue sur un intervalle I (non réduit à un point) de . Étant donné un entier naturel r, le moment d’ordre r de f est défini, sous réserve d’existence, par :

m_r(f) \triangleq \int_{x \in I} x^r \, f(x) \, \mathrm{d}x

Critère d’existence[modifier | modifier le code]

Ce moment d’ordre r est considéré comme existant si et seulement si xrf(x) est intégrable, c’est-à-dire si et seulement si xI |xrf(x)| dx converge. Ainsi, même si le moment est une intégrale impropre convergente[1], ce moment est tout de même considéré comme non existant.

De cette manière, si un moment n’existe pas à un ordre donné, alors tous les moments d’ordre supérieur n’existent pas non plus. Inversement, si un moment existe à un ordre donné, alors tous les moments d’ordre inférieur existent également.

Espace vectoriel[modifier | modifier le code]

Pour un entier naturel r donné, l’ensemble des fonctions continues sur I dont le moment d’ordre r existe est un espace vectoriel réel, et l’application mr : fmr(f) est une forme linéaire sur cet espace vectoriel.

Définitions[modifier | modifier le code]

Soit X une variable aléatoire réelle définie sur I, de fonction de répartition FX et de loi de probabilité p.

Moment ordinaire[modifier | modifier le code]

Le moment (ou moment ordinaire, ou moment en 0) d’ordre r ∈ ℕ de X est défini, s’il existe, par :

m_r \triangleq \mathbb{E}(X^r)

On a donc, d’après le théorème de transfert :

m_r = \int_{x \in I} x^r \, \mathrm{d}F_X(x)

Cette intégrale de Stieltjes peut se réécrire :

D’après le deuxième axiome des probabilités, on a alors m0 = 1.

On notera que, p étant positive ou nulle sur I (premier axiome des probabilités), le critère d’existence du moment d’ordre r est la convergence de kI |k|rpk ou de xI |x|rp(x) dx selon le cas.

Moment centré[modifier | modifier le code]

Le moment centré d’ordre r ∈ ℕ de X est défini, s’il existe, par :

\mu_r \triangleq \mathbb{E}([X - \mathbb{E}(X)]^r)

On a donc, d’après le théorème de transfert :

\mu_r = \int_{x \in I} [x - \mathbb{E}(X)]^r \, \mathrm{d}F_X(x)

Cette intégrale de Stieltjes peut se réécrire :

Par construction, on a alors μ0 = 1 et μ1 = 0.

D’après le théorème de transfert, on peut également écrire μr(X) = mr(X - 𝔼(X)).

Moment centré réduit[modifier | modifier le code]

Article détaillé : Variable centrée réduite.

En posant μ = m1 et σ = √μ2, le moment centré réduit d’ordre r ∈ ⟦2;+∞⟦ de X est défini, s’il existe, par :

\beta_{r-2} \triangleq \mathbb{E} \left[ \left( \frac{X - \mu}{\sigma} \right)^r \right]

On a donc βr-2 =  μr/σr et, par construction, β0 = 1.

Moments remarquables[modifier | modifier le code]

Certains moments, utilisés couramment pour caractériser une variable aléatoire réelle X, sont connus sous un nom particulier :

Fonction génératrice des moments[modifier | modifier le code]

Article détaillé : Fonction génératrice des moments.

La fonction génératrice des moments MX d’une variable aléatoire réelle X est la série génératrice exponentielle associée à la suite (mr)r ∈ ℕ des moments de X, définie au voisinage de 0 et sous réserve d’existence de tous les moments :

M_X(t) \triangleq \sum_{r=0}^{\infty} m_r \, \frac{t^r}{r!}

Elle peut également s’écrire, au voisinage de 0 et sous réserve d’existence de l’espérance :

M_X(t) = \mathbb{E} \left (\mathrm{e}^{tX} \right)

Les dérivées itérées en 0 de cette série génératrice exponentielle valent :

M_X^{(r)}(0) = m_r

Propriétés[modifier | modifier le code]

Dimension[modifier | modifier le code]

Soit [X] la dimension de la variable aléatoire réelle X.

Les moments ordinaire et centré d’ordre r, s’ils existent, ont pour dimension [Xr].

Le moment centré réduit d’ordre r, s’il existe, est une grandeur sans dimension.

Transformation affine[modifier | modifier le code]

Sur les moments ordinaires[modifier | modifier le code]

Le moment ordinaire d’ordre 1, s’il existe, est linéaire :

\forall (\theta, \lambda) \in \R^2, m_1(\theta \, X + \lambda) = \theta \, m_1(X) + \lambda

Le moment ordinaire d’ordre r > 1 de θX + λ, s’il existe, ne s’exprime pas uniquement en fonction du moment d’ordre r de X :

\forall (\theta, \lambda) \in \R^2, m_r(\theta \, X + \lambda) = \sum_{i=0}^r C_r^i \, \theta^{r-i} \, \lambda^i \, m_{r-i}(X) = \sum_{i=0}^r C_r^i \, \theta^i \, \lambda^{r-i} \, m_i(X)

On retrouve ainsi la linéarité de m1 et la constance de m0.

Sur les moments centrés[modifier | modifier le code]

Le moment centré d’ordre r, s’il existe, est invariant par translation et homogène de degré r :

\forall (\theta, \lambda) \in \R^2, \mu_r(\theta \, X + \lambda) = \theta^r \, \mu_r(X)

Sur les moments centrés réduits[modifier | modifier le code]

Par transformation affine de coefficient directeur non nul (afin que σ soit non nul), le moment centré réduit d’ordre r, s’il existe, est simplement multiplié par le signe du coefficient directeur élevé à la puissance r :

\forall (\theta, \lambda) \in \R^* \!\! \times \! \R, \beta_{r-2}(\theta \, X + \lambda) = \sgn(\theta)^r \, \beta_{r-2}(X)

La valeur absolue d’un moment centré réduit est donc invariante par transformation affine de pente non nulle.

En distinguant selon le signe de θ et la parité de r, on peut donc écrire :

\forall (\theta, \lambda) \in \R^* \!\! \times \! \R, \beta_r(\theta \, X + \lambda) = \begin{cases}
\beta_r(X)  & \text{si } \theta > 0 \text{ ou } r \text{ est pair} \\
-\beta_r(X) & \text{si } \theta < 0 \text{ et } r \text{ est impair}
\end{cases}

Additivité[modifier | modifier le code]

Soient X et Y deux variables aléatoires réelles, on a alors :

  • m_1(X + Y) = m_1(X) + m_1(Y)

Si X et Y sont indépendantes, on a en outre :

  • \mu_2(X + Y) = \mu_2(X) + \mu_2(Y)
  • \mu_3(X + Y) = \mu_3(X) + \mu_3(Y)

Cette propriété d’additivité n’existe que pour les trois cas particuliers cités[3].

Relations entre moments ordinaires et moments centrés[modifier | modifier le code]

Moments centrés en fonction des moments ordinaires[modifier | modifier le code]

Le moment centré d’ordre r, s’il existe, s’écrit :

\mu_r = \sum_{i=0}^r C_r^i \, m_{r-i} \, (-m_1)^i = \sum_{i=0}^r C_r^i \, m_i \, (-m_1)^{r-i}

En rappelant que m0 = 1, les premiers moments centrés s’expriment donc, en fonction des moments ordinaires :

\mu_2 = m_2 - m_1^2
\mu_3 = m_3 - 3 \, m_2 \, m_1 + 2 \, m_1^3
\mu_4 = m_4 - 4 \, m_3 \, m_1 + 6 \, m_2 \, m_1^2 - 3 \, m_1^4
\mu_5 = m_5 - 5 \, m_4 \, m_1 + 10 \, m_3 \, m_1^2 - 10 \, m_2 \, m_1^3 + 4 \, m_1^5
\mu_6 = m_6 - 6 \, m_5 \, m_1 + 15 \, m_4 \, m_1^2 - 20 \, m_3 \, m_1^3 + 15 \, m_2 \, m_1^4 - 5 \, m_1^6

Moments ordinaires en fonction des moments centrés[modifier | modifier le code]

Réciproquement, en posant μ = 𝔼(X), le moment ordinaire d’ordre r, s’il existe, s’écrit :

m_r = \sum_{i=0}^r C_r^i \, \mu_{r-i} \, \mu^i = \sum_{i=0}^r C_r^i \, \mu_i \, \mu^{r-i}

En rappelant que μ0 = 1 et μ1 = 0, les premiers moments ordinaires s’expriment donc, en fonction des moments centrés et de μ :

m_2 = \mu_2 + \mu^2
m_3 = \mu_3 + 3 \, \mu_2 \, \mu + \mu^3
m_4 = \mu_4 + 4 \, \mu_3 \, \mu + 6 \, \mu_2 \, \mu^2 + \mu^4
m_5 = \mu_5 + 5 \, \mu_4 \, \mu + 10 \, \mu_3 \, \mu^2 + 10 \, \mu_2 \, \mu^3 + \mu^5
m_6 = \mu_6 + 6 \, \mu_5 \, \mu + 15 \, \mu_4 \, \mu^2 + 20 \, \mu_3 \, \mu^3 + 15 \, \mu_2 \, \mu^4 + \mu^6

Estimateur non biaisé des moments ordinaires[modifier | modifier le code]

À partir d’un échantillon {X1, X2, …, Xn} de la variable aléatoire réelle X, on peut utiliser comme estimateur sans biais du moment ordinaire d’ordre r, s’il existe, l’estimateur suivant :

\hat{m_r} = \frac{1}{n} \sum_{i=1}^{n} X_i^{\ r}

Problème des moments[modifier | modifier le code]

Article détaillé : Problème des moments.

Tandis que le calcul des moments consiste à déterminer les moments mr d’une loi de probabilité p donnée, le problème des moments consiste inversement à étudier l’existence et l’unicité d’une loi de probabilité p dont les moments mr sont donnés.

Extension de la notion de moment[modifier | modifier le code]

Sur le modèle des moments 𝔼(Xr), d’autres moments peuvent être définis :

  • le moment inverse en 0 d’ordre r sur I ∌ 0 : \mathbb{E}(X^{-r})
  • le moment logarithmique d’ordre r sur I ⊂ ℝ*+ : \mathbb{E}[\ln^r(X)]
  • le moment factoriel d’ordre r : \mathbb{E}(X^{\underline{r}}) (factorielle décroissante)

Notes et références[modifier | modifier le code]

  1. Ce cas arrive par exemple pour les moments d’ordre impair d’une fonction paire définie sur  : même si x∈ℝ |xrf(x)| dx diverge, la fonction xxrf(x) est impaire donc a une primitive paire, d’où ∀ t ∈ ℝ, ∫t-t  xrf(x) dx = 0, donc x∈ℝ xrf(x) dx est une intégrale impropre convergente valant 0.
  2. Pour des raisons historiques et en accord avec la notation des cumulants réduits, le coefficient d’asymétrie est noté γ1 plutôt que β1.
  3. Formellement parlant, sachant que μ1 = 0, on pourrait ajouter le cas dégénéré μ1(X + Y) = μ1(X) + μ1(Y), mais cela n’apporte aucune information utile à l’étude de X + Y.