Loi de probabilité à plusieurs variables

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Dans certains problèmes interviennent simultanément plusieurs variables aléatoires. Mis à part les cas particuliers de variables indépendantes (notion définie ci-dessous) et de variables liées fonctionnellement, cela introduit la notion de loi de probabilité à plusieurs variables autrement appelée loi jointe. La description des notions correspondantes, certaines d'entre elles généralisant les notions relatives à une seule variable, est simplifiée de deux manières :

  • Seules les variables continues sont considérées. Il est possible de passer aux variables discrètes en utilisant la fonction de Heaviside et la fonction de Dirac.
  • Pour éviter la lourdeur des formules, l'exposé est limité à deux variables.

Formules de base[modifier | modifier le code]

La probabilité pour que la variable aléatoire X\, prenne une valeur numérique inférieure à x\, alors que Y\, prend une valeur inférieure à y\, définit la fonction de répartition :

F(x,y) = \mathbb{P}(X<x,Y<y)

Celle-ci est non décroissante en x\, et en y\, entre la valeur 0 lorsque les deux variables tendent vers -\infty\, et la valeur 1 lorsqu'elles tendent toutes deux vers +\infty\,.

La densité de probabilité jointe ou loi jointe s'obtient par une double dérivation :

f_{XY}(x,y) = \frac{\partial^2 F_{XY}}{\partial x \partial y}(x,y)

Une intégration par rapport à y\, (resp. x\,) donne la densité de probabilité marginale ou loi marginale de X\,(resp. Y\,) :

f_X (x) = \int_{-\infty}^\infty f_{XY}(x,y) \mathrm dy

Le rapport de la densité de probabilité jointe (relative à une valeur x\,) à la densité marginale de Y\, (concernant toutes les valeurs x\,) représente la densité de probabilité conditionnelle de X\, sous la condition Y = y\, :

 f_{X|Y}(x,y) = \frac {f_{XY}(x,y)} {f_{Y}(y)}

Espérances mathématiques[modifier | modifier le code]

L'espérance mathématique d'une fonction f\, de deux variables généralise la formule donnée pour une seule variable :

\mathbb{E}[f(X,Y)] = \int_{-\infty}^\infty \int_{-\infty}^\infty\ f(x,y) p_{XY}(x,y) \mathrm dx \mathrm dy

L'opérateur espérance est linéaire ; en particulier, l'espérance (la moyenne) d'une somme de deux variables aléatoires est la somme des moyennes :

\mathbb{E}[X + Y] = \mathbb{E}[X] + \mathbb{E}[Y]\,

Parmi ces espérances, une double transformation de Fourier conduit à la fonction caractéristique:

\varphi_{XY} (\theta,\psi) = \mathbb{E}[e^{i(\theta X + \psi Y)}]

Comme pour le cas d'une seule variable aléatoire un développement en série permet de faire apparaître les moments que l'on peut centrer par soustraction des moyennes.

Indépendance[modifier | modifier le code]

Si la densité de probabilité conditionnelle de X\, par rapport à Y\, est identique à la densité marginale :

 p_{X}(x) = \frac {p_{XY}(x,y)} {p_{Y}(y)}

on dit que les deux variables sont indépendantes. L'égalité se réécrit :

p_{XY}(x,y) = p_{X}(x) p_{Y}(y)\,

La fonction caractéristique de la somme des variables est alors égale au produit des fonctions caractéristiques individuelles :

Z = X + Y \qquad \varphi_{Z} (\theta) = \varphi_{X} (\theta) \varphi_{Y} (\theta)

C'est l'une des principales propriétés de la fonction caractéristique. Cette remarque est, entre autres, utilisée dans la démonstration du théorème de la limite centrale.

Corrélation[modifier | modifier le code]

On appelle corrélation de deux variables aléatoires la grandeur:

\rho=\frac{\mathbb{E}[(X-\overline X) (Y -\overline Y)]}{\sigma(X)\sigma(Y)}

\sigma(X)=\sqrt{\mathbb{E}[(X-\overline{X})^2]} est l'écart-type de la variable X. La corrélation de deux variables est comprises entre -1 et 1. Pour une corrélation proche de 1 la variable X aura tendance à être grande quand Y le sera et vice versa. Pour une corrélation proche de -1 la variable X aura tendance à être petite quand Y le sera grande. Si la covariance est nulle on dit que les deux variables sont décorrélées. La formule se développe alors en:

\mathbb{E}[XY] = \mathbb{E}[X] \mathbb{E}[Y]\,

Si les deux variables sont indépendantes, elles sont décorrélées, l'inverse n'étant pas vrai, car l'indépendance implique tous les moments au lieu d'un seul. La notion de variables décorrélées est plus faible que celle d'indépendance et est loin d'avoir la même utilité.