Inégalité de Le Cam

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L’inégalité de Le Cam[1], due à Lucien Le Cam, précise la rapidité de convergence de la loi de la somme d'un grand nombre de variables de Bernoulli indépendantes de petit paramètre vers la loi de Poisson. Sa démonstration, élégante et peu calculatoire, illustre la méthode de couplage popularisée par Wolfgang Döblin.

Énoncé[modifier | modifier le code]

Soit \scriptstyle\ (X_{1,n},  X_{2,n},\dots, X_{a_n,n})_{n\ge 1}\ un tableau de variables aléatoires de Bernoulli indépendantes, avec paramètres respectifs \scriptstyle\   p_{k,n}.\ On note

S_n=\sum_{k=1}^{a_n}\,X_{k,n}\quad\text{et}\quad\lambda_n\  =\ \mathbb{E}[S_n]=\sum_{k=1}^{a_n}\,p_{k,n}.\

Alors

Inégalité de Le Cam — Pour tout ensemble A d'entiers naturels,

\left|\mathbb{P}\left(S_n\in  A\right)-\sum_{\ell\in   A}\,\frac{\lambda_n^\ell\,e^{-\lambda_n}}{\ell!}\right|\   \le\ \sum_{k=1}^{a_n}\,p_{k,n}^2.

En particulier, Sn suit approximativement la loi de Poisson de paramètre λ dès que les deux conditions suivantes sont réunies :

  • \lim_n \lambda_n\,=\,\lambda>0,\
  • \lim_n  \sum_{k=1}^{a_n}\,p_{k,n}^2\,=\,0.\

En effet, l'inégalité de Le Cam entraine que :

\sum_{\ell\in\mathbb{N}}\ \left|\mathbb{P}\left(S_n=\ell\right)-\,\frac{\lambda_n^\ell\,e^{-\lambda_n}}{\ell!}\right|\    \le\ 2\ \sum_{k=1}^{a_n}\,p_{k,n}^2.

Conséquence : paradigme de Poisson[modifier | modifier le code]

Posons

M_n=\max_{1\le k\le a_n}\,p_{k,n}.

On a les inégalités :

M_n^2\le\sum_{1\le  k\le a_n}\,p_{k,n}^2\le M_n\lambda_n,\quad\text{et}\quad a_n\ge \lambda_n/M_n,

donc les deux conditions \scriptstyle\  \lim_n \lambda_n\,=\,\lambda>0,\  et \scriptstyle\  \lim_n  \sum_{k=1}^{a_n}\,p_{k,n}^2\,=\,0,\  apparaissant à la section précédente, entrainent que

  • \lim_n  M_n\,=\,0,\
  • \lim_n  a_n\,=\,+\infty.\

Les deux conditions \scriptstyle\  \lim_n  M_n\,=\,0\  et \scriptstyle\  \lim_n  a_n\,=\,+\infty\  sont souvent reformulées informellement de la manière suivante :

Paradigme de Poisson —  La somme Sn d'un grand nombre de variables de Bernoulli indépendantes de petit paramètre suit approximativement la loi de Poisson de paramètre \scriptstyle\  \mathbb{E}[S_n]. \

Remarques[modifier | modifier le code]

Démonstration[modifier | modifier le code]

Couplage loi de Bernoulli-loi de Poisson[modifier | modifier le code]

L'idée est d'exhiber une loi de probabilité μp, sur le plan, dont la première marginale est une loi de Bernoulli, la seconde une loi de Poisson, toutes deux d'espérance p, telle que le poids de la première bissectrice soit maximal. En d'autres termes, il s'agit de construire, sur un espace probabilisé bien choisi, deux variables aléatoires réelles X et Y, X suivant la loi de Bernoulli de paramètre p, Y suivant la loi de Poisson de paramètre p, de sorte que \scriptstyle\ \mathbb{P}(X\neq Y)\ soit minimal, ou, du moins, suffisamment petit, μp étant alors la loi jointe du couple (X,Y). Il est clair que

\mathbb{P}(X=Y=k)\le \min\left(\mathbb{P}(X=k),\mathbb{P}(Y=k)\right),

donc que

\mathbb{P}(X=Y)\le \sum_k\ \min\left(\mathbb{P}(X=k),\mathbb{P}(Y=k)\right).

Dans le cas Poisson-Bernoulli, cette borne est atteinte en utilisant le théorème de la réciproque, de manière à construire X et Y sur l'intervalle ]0,1[ muni de la mesure de Lebesgue[3]. Ainsi

X(\omega)\ =\ 1\!\!1_{[1-p,1[}(\omega),

alors que

Y(\omega)\ =\  1\!\!1_{[e^{-p},(1+p)e^{-p}[}(\omega)\,+\,2\,1\!\!1_{[(1+p)e^{-p},(1+p+(p^2/2))e^{-p}[}(\omega)\,+\,\dots,

En ce cas, X et Y coincident sur les intervalles :

  • ]0,1-p[, où les 2 variables valent 0,
  • et [e-p,(1+p)e-p[, où les 2 variables valent 1.

Les deux variables diffèrent sur le complémentaire de la réunion de ces deux intervalles, i.e. sur [1-p,1[ \ [e-p,(1+p)e-p[. Ainsi,

\mathbb{P}(X=Y)= \sum_k\ \min\left({\scriptstyle\mathbb{P}(X=k),\mathbb{P}(Y=k)}\right)=\min(1-p,e^{-p})+\min(p,pe^{-p})=1-p+pe^{-p},

et

\mu_p(\{(x,y)\,|\,x\neq y\})\ =\ \mathbb{P}(X\neq Y)\ =\  p\left(1-e^{-p}\right)\ \le\ p^2.

Conclusion[modifier | modifier le code]

On se donne une suite de variables aléatoires indépendantes \scriptstyle\ (Z_{k,n})_{1\le k\le n},\ à valeurs dans le plan, telle que la loi de probabilité de chaque terme \scriptstyle\ Z_{k,n}\ de la suite est \scriptstyle\ \mu_{p_{k,n}}.\ On note \scriptstyle\ X_{k,n}\ et \scriptstyle\ Y_{k,n}\ les deux coordonnées de \scriptstyle\ Z_{k,n},\ et on pose

W_n=\sum_{k=1}^{a_n}\,Y_{k,n}.

Ainsi :

  • les \scriptstyle\ X_{k,n}\ sont indépendantes et suivent des lois de Bernoulli de paramètres \scriptstyle\ p_{k,n}\ ;
  • leur somme Sn a donc la loi que nous voulons étudier ;
  • les \scriptstyle\ Y_{k,n}\ sont indépendantes et suivent des lois de Poisson de paramètres \scriptstyle\ p_{k,n}\ ;
  • Wn suit la loi de Poisson de paramètre \scriptstyle\ \lambda_n\ =\ \sum_{k=1}^{a_n}\,p_{k,n},\ étant la somme de variables de Poisson indépendantes de paramètres \scriptstyle\ p_{k,n}\ ;
  • en particulier, l'approximation proposée pour \scriptstyle\ \mathbb{P}\left(S_n\in  A\right)\ se trouve être :
\mathbb{P}\left(W_n\in  A\right)\ =\ \sum_{\ell\in   A}\,\frac{\lambda_n^\ell\,e^{-\lambda_n}}{\ell!}\ ;
  • \scriptstyle\ \mathbb{P}(X_{k,n}\neq Y_{k,n})\ \le\ p_{k,n}^2.

On a

\begin{align}
\mathbb{P}\left(S_n\in  A\right)-\mathbb{P}\left(W_n\in  A\right)&\le\mathbb{P}\left(S_n\in  A\right)-\mathbb{P}\left(W_n\in  A\text{ et }S_n\in  A\right)
\\
&=\mathbb{P}\left(S_n\in   A\text{ et }W_n\notin  A\right)
\\
&\le\mathbb{P}\left(S_n\neq W_n\right)
\end{align}

et, en échangeant le rôle de Wn et celui de Sn ,

\left|
\mathbb{P}\left(S_n\in  A\right)-\mathbb{P}\left(W_n\in  A\right)\right|\le\mathbb{P}\left(S_n\neq W_n\right).

Par ailleurs, comme

\{S_n\neq W_n\}\ \Rightarrow\ \left\{\exists k\text{ tel que }X_{k,n}\neq Y_{k,n}\right\},

on en déduit que

\{\omega\in\Omega\,|\,S_n(\omega)\neq W_n(\omega)\}\ \subset\ \bigcup_{1\le k\le a_n}\left\{\omega\in\Omega\,|\,X_{k,n}(\omega)\neq Y_{k,n}(\omega)\right\},

Finalement


\mathbb{P}\left(S_n\neq W_n\right)\ \le\ \sum_{1\le k\le a_n}\mathbb{P}\left(\,X_{k,n}\neq Y_{k,n}\right)\ \le\ \sum_{1\le k\le a_n}\ p_{k,n}^2.

À voir[modifier | modifier le code]

Notes[modifier | modifier le code]

  1. Article original : (en) L. Le Cam, « An Approximation Theorem for the Poisson Binomial Distribution », Pacific Journal of Mathematics, vol. 10, no 4,‎ 1960, p. 1181–1197 (lire en ligne). Une référence accessible en ligne est (en) Torgny Lindvall, Lectures on the coupling method, John Wiley & Sons,‎ 1992, 1e éd., 257 p. (ISBN 0 471 54025 0), p. 4-6.
  2. (en) A. D. Barbour, L. Holst et S. Janson, Poisson approximation, The Clarendon Press Oxford University Press,‎ 1992 (ISBN 0-19-852235-5).
  3. Voir (en) Torgny Lindvall, Lectures on the coupling method, John Wiley & Sons,‎ 1992, 1e éd., 257 p. (ISBN 0 471 54025 0), p. 18-20, Section 1.5, particulièrement le Théorème 5.2, pour une discussion du lien avec la distance en variation, et pour une preuve de ce que cette borne peut toujours être atteinte à l'aide d'une construction appropriée de X et Y.

Bibliographie[modifier | modifier le code]

  • (en) Torgny Lindvall, Lectures on the Coupling Method, Dover Publications,‎ 30 août 2002, 2e éd., paperback, 272 p. (ISBN 0-486-42145-7 et 978-0486421452)

Pages liées[modifier | modifier le code]