Lemme de Scheffé

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Ne doit pas être confondu avec Théorème de Lehman-Scheffé.

Le lemme de Scheffé (en) est un critère de convergence en loi concernant les suites de variables aléatoires à densité.

Énoncé et démonstration[modifier | modifier le code]

Lemme de Scheffé —  Soit \scriptstyle\ (f_{n})_{n\ge 0}\ une suite de densités de probabilité définies sur le même ensemble \scriptstyle\ E\ et par rapport à la même mesure \scriptstyle\ \mu\ sur l'espace mesurable \scriptstyle\ (E,\mathcal E)\ . Supposons que \scriptstyle\ (f_{n})_{n\ge 0}\ converge \scriptstyle\ \mu-\ presque partout vers une densité de probabilité \scriptstyle\ f.\ Alors

  • \scriptstyle\ (f_{n})_{n}\ converge vers \scriptstyle\ f\ dans \scriptstyle\ L_{1},\
  • si les variables aléatoires \scriptstyle\ X_{n}\ et \scriptstyle\ X\ ont pour densités respectives \scriptstyle\ (f_{n})_{n}\ et \scriptstyle\ f,\ alors \scriptstyle\ X_{n}\ converge en loi vers \scriptstyle\ X.\

Remarques.

  • De manière un peu surprenante, lorsque des fonctions sont positives et ont la même intégrale, on est donc affranchi des hypothèses habituelles de majoration uniforme de l'erreur apparaissant dans le théorème de convergence dominée.
  • En général, on applique le lemme de Scheffé dans le cas où \scriptstyle\ E=\mathbb{R}^d\ et où la mesure \scriptstyle\ \mu\ est la mesure de Lebesgue : les variables aléatoires apparaissant dans le lemme sont alors des variables "à densité".
  • Un autre cadre d'application du lemme de Scheffé concerne des densités par rapport à la mesure de comptage \scriptstyle\ \mu\ sur \scriptstyle\ E=\mathbb{Z}^d\  : les variables aléatoires apparaissant dans le lemme sont alors des variables "discrètes" et la densité \scriptstyle\ f_{n}\ de \scriptstyle\ X_{n}\ est définie, pour \scriptstyle\ k\in\mathbb{Z}^d,\ par

f_{n}(k)\ =\ \mathbb{P}\left(X_{n}=k\right).
Dans ce cadre, il découle du lemme de Scheffé que \scriptstyle\ X_{n}\ converge en loi vers \scriptstyle\ X\ si (et seulement si) :

\forall k\in\mathbb{Z}^d,\qquad \lim_{n}\mathbb{P}\left(X_{n}=k\right)\ =\ \mathbb{P}\left(X=k\right).
  • Sous les hypothèses du lemme de Scheffé, on obtient en fait une convergence plus forte que la convergence en loi :

\forall A\in \mathcal E, \quad\left|\mathbb{P}\left(X_{n}\in A\right)-\mathbb{P}\left(X\in A\right)\right|\ \le\ \Vert f_n-f\Vert_1.
La convergence des probabilités est donc uniforme sur \scriptstyle\ \mathcal E.\ Pourtant, la convergence en loi, d'ordinaire, ne s'accompagne pas forcément d'une convergence simple (ni, a fortiori, d'une convergence uniforme) sur \scriptstyle\ \mathcal E\  : par exemple, si Y est gaussien standard, si \scriptstyle\ X_n=Y/n,\quad A=\{0\},\ alors

\lim_n\mathbb{P}\left(X_{n}\in A\right)=0\neq1=\mathbb{P}\left(0\in A\right),
alors que, pour autant, \scriptstyle\ X_n\ converge en loi vers 0.

Exemples[modifier | modifier le code]

Convergence de la loi de Student vers la loi normale[modifier | modifier le code]

Un exemple d'application est la convergence de la loi de Student vers la loi normale. Pour k ≥ 1, la loi de Student à k degrés de liberté a pour densité

f_k(t)=\frac{1}{\sqrt{k\pi}}\frac{\Gamma(\frac{k+1}{2})}{\Gamma(\frac{k}{2})}\frac{1}{(1+\frac{t^2}{k})^{\frac{k+1}{2}}},

Γ désigne la fonction Gamma d'Euler. On a classiquement, pour tout \scriptstyle\ t\in\mathbb{R},[1]

\lim_k\left(1+\frac{t}{k}\right)^{k}=e^{t},

et donc

\begin{align}\lim_k\frac{1}{(1+\tfrac{t^2}{k})^{\tfrac{k+1}{2}}}&=\lim_k\frac{1}{(1+\tfrac{t^2}{k})^{\tfrac{k}{2}}}\times \lim_k\left(1+\tfrac{t^2}{k}\right)^{-\tfrac{1}{2}}\\
&=\left(\lim_k\left(1+\tfrac{t^2}{k}\right)^k\right)^{-\tfrac{1}{2}}=e^{-t^2/2}.\end{align}

On a aussi[2]

\lim_{t\uparrow+\infty}\frac{\Gamma(t+\alpha)}{\Gamma(t)t^{\alpha}}=1,

d'où, en posant  {t} = \frac{k}{2}

\lim_k \tfrac{1}{\sqrt{k\pi}}\ \frac{\Gamma(\frac{k+1}{2})}{\Gamma(\frac{k}{2})} = \tfrac{1}{\sqrt{2\pi}}\ \lim_{t\uparrow+\infty}\frac{\Gamma(t+\frac{1}{2})}{\Gamma(t)\sqrt{t}}\ =\ \frac{1}{\sqrt{2\pi}}.

Donc

\lim_kf_k(t)=\frac{1}{\sqrt{2\pi}}\ e^{-t^2/2}.

CQFD

Convergence de la loi binomiale vers la loi de Poisson[modifier | modifier le code]

Pour n ≥ 1 et 0 ≤ pn ≤ 1, la loi binomiale de paramètres n  et pn a pour densité, par rapport à la mesure de comptage sur  \scriptstyle\ \mathbb{Z},\ la fonction fn définie sur \scriptstyle\ \mathbb{Z}\ par

f_n(k)\ =\ {n\choose k}p_n^k(1-p_n)^{n-k}\ 1_{0\le k\le n}.

La suite (fn) converge simplement vers la fonction f définie par :

f(k)\ =\ e^{-\lambda}\ \frac{\lambda^k}{k!}\ 1_{k\ge 0},

dès que

\lim_n n\,p_n\ =\ \lambda,\quad \ \lambda>0 .

Ainsi, en conséquence du lemme de Scheffé, dès que \scriptstyle\ \lim_n n\,p_n\ =\ \lambda,\ \lambda>0,\ la loi binomiale de paramètres n  et pn converge vers la loi de Poisson de paramètre λ.

Variante discrète[modifier | modifier le code]

Sous certaines conditions, on peut adapter le lemme de Scheffé pour démontrer la convergence de lois discrètes vers des lois à densité. Pour un vecteur \scriptstyle\ x\in\mathbb{R}^d, notons \scriptstyle\ \left\lfloor x\right\rfloor\ le vecteur de coordonnées \scriptstyle\ \left\lfloor x_{i}\right\rfloor\ , \scriptstyle\ 1\le i\le d. Alors

Lemme de Scheffé discret —  On se donne une suite de v.a. \scriptstyle\ (X_{n})_{n}\ à valeurs dans \scriptstyle\ \mathbb{Z}^d, une suite \scriptstyle\ a_{n}, tendant vers \scriptstyle\ +\infty, de réels strictement positifs, et une densité de probabilité \scriptstyle\ f sur \scriptstyle\ \mathbb{R}^d. Si p.p. en \scriptstyle\ x on a

\lim_{n} a_{n}^d\ \mathbb{P}\left(X_{n}=\left\lfloor a_{n}x\right\rfloor \right)=f(x),

alors \scriptstyle\ X_{n}/a_{n} converge faiblement vers \scriptstyle\ f(x) dx.

Une fois cette dernière démonstration faite, le lemme de Scheffé discret dispense de trouver une majoration du terme d'erreur


\left|a_{n}^d\ \mathbb{P}\left(X_{n}=\left\lfloor a_{n}x\right\rfloor \right)-f(x)\right|,

uniforme pour \scriptstyle\  x\in A, ce qui serait une manière plus lourde de montrer que


\lim_n\ \mathbb{P}\left(X_{n}/a_n \in A \right)\ =\ \lim_n\ \sum_{k\in(a_n\,A)\cap\mathbb{Z}^d}\ \mathbb{P}\left(X_{n}=k \right)\ =\ \int_A\ f(x)dx.

Habituellement, un contrôle uniforme de la rapidité de convergence des termes de la somme est nécessaire pour assurer la convergence du terme de gauche de l'égalité (le terme de gauche est une somme finie dont le nombre de termes tend vers l'infini) vers l'intégrale limite. Dans ce cas précis, grâce au lemme de Scheffé, la convergence des termes de la somme, renormalisés, suffit pour assurer la convergence du terme de gauche de l'égalité.

Distance entre deux points au hasard d'un arbre de Cayley aléatoire[modifier | modifier le code]

La loi de la distance \scriptstyle\ D_n entre deux points au hasard d'un arbre de Cayley aléatoire, est donnée, pour \scriptstyle\ 0\ \le\ k\ \le\ n-1,\ par

\mathbb{P}\left(D_n=k\right)\ =\ \frac{(k+1)\times(n)_{\downarrow k+1}}{n^{k+2}}.

En vertu de la bijection de Joyal, c'est aussi la loi du nombre de points cycliques d'une application de \scriptstyle\ [\![1,n]\!] dans \scriptstyle\ [\![1,n]\!].\ Cette loi discrète apparaît aussi dans des problèmes d'allocations (boules et urnes), dont le fameux problème des anniversaires. Lorsqu'on alloue séquentiellement des boules dans un ensemble de n urnes, avec équiprobabilité, ce qui revient à considérer un univers probabiliste \scriptstyle\ \Omega\ =\ [\![1,n]\!]^{\mathbb{N}},\ le rang \scriptstyle\ T_n(\omega)\ de la première boule à être allouée dans une urne non vide suit la même loi que \scriptstyle\ 2+D_n\  : pour \scriptstyle\ 2\ \le\ k\ \le\ n+1,\

\mathbb{P}\left(T_n=k\right)\ =\ \mathbb{P}\left(D_n=k-2\right).

On peut montrer, à l'aide du lemme de Scheffé, que

Proposition — \scriptstyle\ D_n/\sqrt{n} converge en loi vers la loi de Rayleigh.

En conséquence :

  • la distance "typique" entre deux points d'un arbre de taille n est de l'ordre de \scriptstyle\ \sqrt{n}\ ;
  • \scriptstyle\ T_n/\sqrt{n} converge en loi vers la loi de Rayleigh. Dans le cadre du problème des anniversaires, où l'on choisit n=365, \scriptstyle\ T_n(\omega)\ s'interprète comme la taille du groupe pour laquelle il devient probable qu'au moins deux membres du groupe ait la même date d'anniversaire (il faut imaginer un groupe dont l'effectif augmente progressivement)  : la probabilité que dans un groupe de \scriptstyle\ \alpha\sqrt{n}\ personnes, toutes les dates d'anniversaire soit différentes, peut être estimée comme suit :
\mathbb{P}\left(T_n>\alpha\sqrt{n}\right)=\mathbb{P}\left(T_n/\sqrt{n}\ >\alpha\right)\simeq\int_{\alpha}^{+\infty}x\ \exp\left(-x^2/2\right)dx\ =\ e^{-\alpha^2/2},
et vaut donc 1/2 pour un groupe d'approximativement \scriptstyle\ \sqrt{365\times2\ln(2)}\ (soit 22,5) personnes, ou bien 1/10 pour un groupe d'approximativement \scriptstyle\ \sqrt{365\times2\ln(10)}\ (soit 41) personnes. Le calcul exact du premier entier tel que cette probabilité soit plus petite que 1/2 (respectivement 1/10) donne les mêmes résultats : 23 (respectivement 41).

Un contrexemple : la marche aléatoire simple symétrique[modifier | modifier le code]

Notons \scriptstyle\ S_{n} la position de la marche aléatoire simple symétrique au temps \scriptstyle\ n. Abraham De Moivre a montré que \scriptstyle\ S_{n}/\sqrt n converge en loi vers \scriptstyle\ e^{-x^2/2}/\sqrt{2\pi}\ dx.\ Ce faisant, Abraham De Moivre a mis à son compte 3 « premières » :

Malheureusement, on ne peut pas appliquer directement le lemme de Scheffé discret pour prouver le résultat de De Moivre. En effet :

\limsup_{n} \sqrt{n}\ \mathbb{P}\left(S_{n}=\left\lfloor \sqrt{n}\ x\right\rfloor \right)=2e^{-x^2/2}/\sqrt{2\pi},

et

\liminf_{n} \sqrt{n}\ \mathbb{P}\left(S_{n}=\left\lfloor \sqrt{n}\ x\right\rfloor \right)=0.

Comme \scriptstyle\ S_{n} est de même parité que \scriptstyle\ n, la suite \scriptstyle\ \mathbb{P}\left(S_{n}=\left\lfloor \sqrt{n}x\right\rfloor \right)\ prend la valeur zero pour une infinité d'indices, ceux pour lesquels \scriptstyle\ \left\lfloor \sqrt{n}\ x\right\rfloor et \scriptstyle\ n\ n'ont pas la même parité : dès que \scriptstyle\ x\neq 0, on peut vérifier à la main que \scriptstyle\ \left\lfloor \sqrt{2n}\ x\right\rfloor est impair pour une infinité d'indices (et pair pour une infinité d'indices également), un constat analogue pouvant être fait pour \scriptstyle\ \left\lfloor \sqrt{2n+1}\ x\right\rfloor. En revanche, lorsque \scriptstyle\ \left\lfloor \sqrt{n}\ x\right\rfloor et \scriptstyle\ n\ ont même parité, on a:

\mathbb{P}\left(S_{n}=\left\lfloor \sqrt{n}x\right\rfloor \right)\ =\ {n\choose \left(n+\left\lfloor \sqrt{n}x\right\rfloor\right)/2}\ 2^{-n}.

La formule de Stirling conduit alors à la limite annoncée, \scriptstyle\ 2\,e^{-x^2/2}/\sqrt{2\pi}.\ On peut cependant adapter la démonstration du lemme de Scheffé discret à ce cas particulier : il suffit de poser


Y_{n}
=
\frac{S_{n}-1_{n\text{ impair}}+2U}{\sqrt{n}}.

Alors \scriptstyle\ Y_{n}\ a pour densité


\frac{\sqrt{n}}2\ \mathbb{P}\left(S_{n}=1_{n\text{ impair}}+2\left\lfloor \frac{\sqrt{n}x}2\right\rfloor \right)\ \simeq\ \,e^{-x^2/2}/\sqrt{2\pi},

toujours via la formule de Stirling. Ainsi \scriptstyle\ Y_{n}\ converge en loi vers la loi normale, en vertu du lemme de Scheffé. Mais, comme plus haut,


\left\Vert  Y_{n}-\frac{S_{n}}{\sqrt{n}}\right\Vert\  =\ \mathcal{O}\left(  \frac1{\sqrt{n}}\right).

Le théorème de de Moivre résulte alors de la convergence en loi de \scriptstyle\ Y_{n},\ et du théorème de Slutsky.

Notes et références[modifier | modifier le code]

  1. formule attribuée à Euler, voir Fonction exponentielle#Par une équation différentielle, et aussi Eli Maor, e: the Story of a Number, p.156.
  2. voir Fonction Gamma#Formule asymptotique de Stirling.

À voir[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

  • (en) Rick Durrett, Probability : Theory and Examples, Thomson Brooks/Cole (Belmont, CA), coll. « Duxbury advanced series »,‎ 2005, 3e éd., 497 p. (ISBN 0534424414), Section II.2.a., page 81.

Pages liées[modifier | modifier le code]