Fonction de répartition

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Fonctions de répartition d'une variable discrète, d'une variable diffuse et d'une variable avec atome, mais non discrète.

En théorie des probabilités ou en statistiques, la fonction de répartition d'une variable aléatoire réelle caractérise la loi de probabilité de cette variable aléatoire réelle. La fonction de répartition de la variable aléatoire réelle  X est la fonction  F_X qui à tout réel  x associe


F_X(x)=\mathbb P(X\leq x),

où le membre de droite représente la probabilité que la variable aléatoire réelle  X prenne une valeur inférieure ou égale à  x. La probabilité que  X se trouve dans l'intervalle  ]a, b] est donc, si  a< b,


\mathbb P(a< X\leq b)\ =\ F_X(b)-F_X(a).

La fonction de répartition d'une mesure de probabilité \mathbb P définie sur la tribu borélienne \mathcal B(\R) est la fonction \  F qui à tout réel  x associe


F(x)=\mathbb P(]-\infty, x]).

Exemples de calculs de la fonction de répartition[modifier | modifier le code]

Variables à densité[modifier | modifier le code]

Fonction de répartition de la loi normale centrée réduite

La fonction de répartition  F_X d'une variable aléatoire  X de densité de probabilité  f_X est une des primitives (en un sens un peu relâché, voir ci-dessous) de cette densité  f_X. Plus précisément,  F_X est définie, pour tout nombre réel x, par :


F_X(x)=\int_{-\infty}^{x} f_X(t)\,\mathrm dt.

Toutefois, ce n'est pas, en toute généralité, une primitive au sens strict du terme : on peut seulement affirmer

Mais il y a beaucoup de « contre-exemples » : la fonction de répartition de la loi uniforme sur un intervalle, ou encore celle de la loi exponentielle, ne sont pas dérivables sur tout  \ \R, et ne sont donc pas, au sens strict, des primitives de densités de probabilités.

Notons que, contrairement aux variables discrètes, une variable à densité X vérifie \mathbb P(X=a)=0 pour tout nombre réel a : en conséquence, la fonction de répartition des variables à densité est continue en tout point. En fait une variable aléatoire réelle X possède une densité de probabilité si et seulement si sa fonction de répartition est absolument continue sur chaque intervalle borné.

Variables discrètes[modifier | modifier le code]

Fonction de répartition de la loi uniforme sur {0.2, 0.4, 0.6, 0.8, 1} (pour laquelle p_i = 0.2, 1\le i\le 5, en bleu) et de la loi uniforme sur l'intervalle [0,1] (en rouge)

Une variable aléatoire X est dite discrète si son support S est fini ou dénombrable, ou bien, de manière équivalente, s'il existe un ensemble A fini ou dénombrable tel que :

\mathbb P(X \in A) = 1.

La loi de X est déterminée sans ambiguïté par la donnée de (p_s)_{s \in S} ou de (p_s)_{s \in A}, où

p_s = \mathbb P(X = s).

Si, par exemple, X est une variable aléatoire réelle, on a

F_X(x) = \sum_{s \in S} p_s 1_{[s, +\infty[}(x).

1_E est la fonction indicatrice de l'ensemble E.

Pour les variables aléatoires discrètes les plus courantes (par exemple, les lois uniformes, binomiales, de Poisson) S est un ensemble bien ordonné : on peut alors numéroter ses éléments de manière croissante, p.e. s_1 \le s_2 \le s_3 \le \dots et numéroter les probabilités p_s en conséquence, p.e. en posant p_i = p_{s_i}, i \ge 1. On a alors, si x\in[s_i,  s_{i + 1}[,

F_X(x) = \sum_{1 \le j\le i}p_j.

Soit encore, plus généralement :


\begin{align}
F_X(x) &= \sum_{i \ge 1}\ q_i\ 1_{[s_i, s_{i + 1}[}(x),
\\
q_i &= \sum_{1 \le j \le i} p_j.
\end{align}

La fonction de répartition est alors une fonction constante par intervalles et sa représentation graphique est en escalier. Les sauts d'une marche à l'autre de l'escalier se situent aux abscisses s_i, et l'amplitude du saut d'abscisse s est p_s = F_X(s) - F_X(s_-). En particulier la fonction de répartition d'une variable discrète X est discontinue exactement aux points s tels que \mathbb P(X = s)> 0. Voir la section Propriétés de la fonction de répartition pour une démonstration.

Miscellanées[modifier | modifier le code]

L'escalier de Cantor F est un exemple de fonction de répartition continue mais dont la dérivée est presque partout nulle. Ainsi, les formules précédentes ne valent pas pour l'escalier de Cantor : pour x>0, on n'a pas


F(x)=\int_{-\infty}^{x} F^{\prime}(t)\, \mathrm{d}t,

car l'escalier de Cantor F prend des valeurs strictement positives sur  ]0, +\infty[, alors que l'intégrale constituant le membre de droite est identiquement nulle. En effet, l'ensemble


\{t\in\R\ |\ F^{\prime}(t)\neq 0\}

est de mesure de Lebesgue nulle. Par ailleurs, la loi de probabilité associée à l'escalier de Cantor est diffuse (sans atome), puisque F est une fonction continue sur \R. L'escalier de Cantor est en fait un exemple de fonction de répartition continue mais qui n'est pas absolument continue sur chaque intervalle.

Propriétés de la fonction de répartition[modifier | modifier le code]

Propriétés caractéristiques[modifier | modifier le code]

Théorème — La fonction de répartition d'une variable aléatoire X a les propriétés caractéristiques suivantes :

  1. FX est croissante ;
  2. Elle est partout continue à droite ;
  3. \lim_{x \to -\infty}F_X(x) = 0 ;
  4.  \lim_{x \to +\infty}F_X(x)=1.

Comme on l'a dit, les points 1 à 4 sont caractéristiques de la fonction de répartition d'une variable aléatoire réelle X : étant donné une fonction réelle de la variable réelle, notons la F, satisfaisant les points 1 à 4, on peut construire concrètement une variable aléatoire réelle X ayant F pour fonction de répartition, voir ci-dessous le théorème de la réciproque. Notons que la construction utilisant le théorème de la réciproque sert concrètement à produire, sur ordinateur, des échantillons de taille arbitraire d'une loi de probabilité arbitraire, ce qui est l'ingrédient de base des méthodes de Monte-Carlo.

Autres propriétés[modifier | modifier le code]

À cause des points 1, 3 et 4, FX est bornée, plus précisément


\forall x \in\R,\ \ \  0\leq F_X(x)\leq 1.

Comme toute fonction monotone bornée, FX admet en tout point x une limite à gauche FX (x ) , limite à gauche égale ou non à FX (x) selon que FX est continue en x ou non. FX est une fonction càdlàg.

La connaissance de la fonction de répartition permet de calculer la probabilité de tout intervalle

  • \mathbb P(X \in ]- \infty;x])\,=\,\mathbb P(X \le x)\,=\,F_X(x),
  • \mathbb P(X \in ]x; + \infty[)\,=\,\mathbb P(X > x)\,=\,1-F_X(x),
  • \mathbb P(X \in ]x;y])\,=\,\mathbb P(x <  X \le y)\,=\,F_X(y) - F_X(x),
  • \mathbb P(X \in ]- \infty;x[)\,=\,\mathbb P(X < x)\,=\,F_X(x_-),
  • \mathbb P(X \in ]x;y[ )\,=\,\mathbb P(x < X < y)\,=\,F_X(y_-)-F_X(x),
  • \mathbb P(X \in [x;y[)\,=\,\mathbb P(x\le X < y)\,=\,F_X(y_-) - F_X(x_-),
  • \mathbb P(X \in [x;y])\,=\,\mathbb P(x \le X \le y)\,=\,F_X(y) - F_X(x_-),

et

  • \mathbb P(X=x) = F_X(x) - F_X(x_-)\,

On appelle atome de la variable aléatoire X tout réel a pour lequel  \mathbb P(X=a)> 0. Ainsi, en vertu de la dernière propriété de la liste ci-dessus,

Propriété — Les atomes de la variable aléatoire X sont exactement les points de discontinuité de la fonction de répartition.

La fonction de répartition d'une variable aléatoire X est donc continue si et seulement si X n'a aucun atome, i.e. si et seulement si

\forall x\in\R,\ \mathbb P[X = x]=0.

On dit alors que la loi de X est diffuse, ou bien sans atome, et, par extension, que la variable aléatoire X elle-même est diffuse ou sans atome. En particulier, les variables aléatoires réelles possédant une densité de probabilité sont diffuses. Il existe cependant des variables aléatoires diffuses mais ne possédant pas pour autant une densité de probabilité, c'est le cas, par exemple, de la variable aléatoire ayant pour fonction de répartition l'escalier de Cantor.

Notons que l'ensemble des points de discontinuité de FX est fini ou dénombrable, comme c'est le cas pour toute fonction monotone bornée :

Conséquence — L'ensemble S des atomes de la variable aléatoire X est fini ou dénombrable.

Caractérisation de la loi par la fonction de répartition[modifier | modifier le code]

Théorème — La loi de probabilité d'une variable aléatoire réelle est caractérisée par sa fonction de répartition.

Ou bien encore : si deux variables aléatoires réelles ont même fonction de répartition, alors elles ont même loi (et réciproquement).

En d'autres termes, si deux variables aléatoires réelles,  X et  Y, vérifient

\forall x\in\R,\qquad \mathbb P(X\le x)=\mathbb P(Y\le x),

alors elles vérifient aussi que pour tout borélien  A,

\mathbb P(X\in A)=\mathbb P(Y\in A).

De plus, elles vérifient que pour toute fonction mesurable  \ \varphi,

\mathbb E[\varphi(X)]=\mathbb E[\varphi(Y)],

dès que l'un des deux termes de l'égalite a un sens.

Théorème de la réciproque[modifier | modifier le code]

Soit  F une fonction de  \R dans  \R satisfaisant les 4 propriétés caractéristiques. Notons  G la fonction définie pour  \omega \in]0,1[ par

G(\omega)=\inf\left\{x\in\R\ |\ F(x)\ge\omega\right\}.

Alors G est une variable aléatoire réelle définie sur l'espace probabilisé  \left(\Omega,\mathcal A,\mathbb P\right) \left(\Omega,\mathcal A\right)=\left(]0,1[,\mathcal B(]0,1[)\right) et où  \mathbb P désigne la restriction à  \mathcal B(]0,1[) de la mesure de Lebesgue sur  \R. Le théorème stipule que :

Théorème — Sur l'espace  \left(\Omega,\mathcal A,\mathbb P\right), la fonction de répartition de  G est  F.

Ainsi toute fonction  F de  \R dans  \R satisfaisant les quatre propriétés caractéristiques est fonction de répartition d'une variable aléatoire réelle (de G, par exemple), ou encore d'une mesure de probabilité sur  \left(\R,\mathcal B(\R)\right) (de la loi de G, par exemple).

Remarques.

  • Lorsque  F est une bijection bicontinue d'un intervalle  I dans  ]0,1[ (i.e.  F est continue strictement croissante),  G est tout simplement la réciproque de  F (i.e.  G\circ F=\text{Id}_I et  F\circ G=\text{Id}_{]0,1[}). Pour cette raison,  G est parfois appelée réciproque généralisée de  F.
  • L'intérêt pratique de ce théorème est développé dans l'article Méthode de la transformée inverse, ainsi que dans la section suivante.

Conséquences du théorème de la réciproque[modifier | modifier le code]

Simulation de variables aléatoires réelles de loi arbitraire[modifier | modifier le code]

Si  U désigne une variable aléatoire réelle uniforme sur [0,1], alors  X=G(U) a pour fonction de répartition  F.

Ainsi dans tout langage de programmation possédant un générateur de nombres aléatoires, on peut simuler une suite de longueur arbitraire de v.a.r. indépendantes de même fonction de répartition  F, pourvu que  G soit connue : il suffit alors d'appeler ce générateur de manière répétée, et d'appliquer la fonction  G aux nombres produits par ces appels répétés.

Exemples[modifier | modifier le code]

Exemples
densité de probabilité fonction de répartition réciproque (généralisée) code
Loi de Cauchy  \frac1{\pi(1+x^2)}  F(x)=\frac1{\pi}\left(\frac{\pi}2+\arctan(x)\right)  G(\omega)=\tan\left(\pi(\omega-\frac12)\right)  x\leftarrow\tan\left(\pi(\mathrm{rand()}-\frac12)\right)
Loi exponentielle  \lambda\,e^{-\lambda x}\ 1_{x\ge 0}  F(x)=\left(1-e^{-\lambda x}\right)\ 1_{x\ge 0}  G(\omega)=-\frac1{\lambda}\ \ln(1-\omega)  x\leftarrow\ -\frac1{\lambda}\ \ln(\mathrm{rand()})
Loi uniforme sur [a,b]  \frac{1}{b-a}\ 1_{[a,b]}(x)  F(x)=\frac{x-a}{b-a}\ 1_{[a,b]}(x)\ +\ 1_{]b,+\infty[}(x)  G(\omega)=a+\omega(b-a)  x\leftarrow a+(b-a)\mathrm{rand()}
Loi de Bernoulli  F(x)=(1-p)\ 1_{[0,1[}(x)\ +\ 1_{[1,+\infty[}(x)  G(\omega)=\lfloor p+\omega\rfloor  x\leftarrow \lfloor p+\ \mathrm{rand()}\rfloor
Loi uniforme sur  \{1,2,\dots,n\}  F(x)=\left\lfloor\frac xn\right\rfloor\ 1_{[0,1]}(x)\ +\ 1_{]1,+\infty[}(x)  G(\omega)=\lceil n\omega\rceil  x\leftarrow \lceil n\ \mathrm{rand()}\rceil
Loi normale, Loi binomiale comme il n'y a pas de formule suffisamment explicite pour la fonction de répartition, et encore moins de formule explicite pour la réciproque de cette dernière, le théorème est alors inopérant.

On trouvera tout sur l'art d'engendrer des variables aléatoires de lois arbitraires, par exemple à l'aide de variables uniformes, dans Non-Uniform Random Variate Generation, édité chez Springer, disponible sur le web[1].

Autres conséquences du théorème de la réciproque[modifier | modifier le code]

La réciproque généralisée de  \ F est un exemple de v.a.r. dont la fonction de répartition est  F, mais c'est un exemple privilégié. Ses utilisations sont nombreuses, allant de propriétés de l'ordre stochastique, à des propriétés de la distance de Wasserstein (en)[2], en passant par le théorème de représentation de Skorokhod, voir section suivante.

Convergence en loi et fonction de répartition[modifier | modifier le code]

Considérons une suite de variables aléatoires  (X_n)_{n\ge 0} (resp. une variable aléatoire  X) définies sur des espaces probabilisés  \left(\Omega_n,\mathcal A_n,\mathbb P_n\right) (resp.  \left(\Omega,\mathcal A,\mathbb P\right)) éventuellement différents, mais toutes à valeurs dans le même espace métrique  (S,d). On dit que  (X_n)_{n\ge 0} converge en loi vers  X si, pour toute fonction continue bornée de  (S,d) dans  \R,

\lim_{n\rightarrow\infty}\mathbb E\left[f(X_n)\right]=\mathbb E\left[f(X)\right].

On a le théorème suivant :

Théorème —  Dans le cas de variables aléatoires réelles ( S=\R), notons  (F_n)_{n\ge 0}, \ F les fonctions de répartitions de  (X_n)_{n\ge 0} et de  X. Il y a alors équivalence entre les trois propositions ci-dessous :

  1.  (X_n)_{n\ge 0} converge en loi vers  X,
  2. pour tout réel  x en lequel  F est continue,  \lim_{n\rightarrow\infty} F_n(x) = F(x),
  3. il existe un espace probabilisé  \left(\widehat{\Omega},\widehat{\mathcal A},\widehat{\mathbb P}\right), et, définies sur cet espace, des variables aléatoires réelles  (X^\prime_n)_{n\ge 0} et  X^\prime telles que, simultanément,
    1.  X^\prime a même loi que  X,
    2. pour chaque  n,  X^\prime_n a même loi que  X_n,
    3.  (X^\prime_n)_{n\ge 0} converge presque sûrement vers  X^\prime.

L'implication 1.⇒3. reste vraie lorsque les variables aléatoires réelles sont remplacées par des variables aléatoires à valeurs dans un espace de Lusin  (S,d), i.e. un espace métrisable assez général ( S=\R^d et  S=\mathcal C([0,1],\R) en sont des exemples). L'implication 1.⇒3. porte alors le nom de théorème de représentation de Skorokhod.

Voir aussi[modifier | modifier le code]

Notes[modifier | modifier le code]

  1. La version pdf (libre et autorisée) de (en) Luc Devroye, Non-Uniform Random Variate Generation, New York, Springer-Verlag,‎ 1986, 1e éd. (lire en ligne) est disponible, ainsi qu'un récit humoristique des démêlés de Luc Devroye avec son éditeur.
  2. [1]

Pages liées[modifier | modifier le code]