Aller au contenu

« Théorème de Glivenko-Cantelli » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Chassain (discuter | contributions)
Chassain (discuter | contributions)
mAucun résumé des modifications
Ligne 1 : Ligne 1 :
En [[Statistiques]], une [[fonction de répartition empirique]] est la [[fonction de répartition]] d'une mesure de probabilités qui attribue la probabilité 1/''n'' à chacun des ''n'' termes d'un [[Échantillon_(statistiques)|échantillon]]: soit <center><math>X_1,\ldots,X_n</math></center>
En [[Statistiques]], une [[fonction de répartition empirique]] est la [[fonction de répartition]] d'une mesure de probabilités qui attribue la probabilité 1/''n'' à chacun des ''n'' termes d'un [[Échantillon_(statistiques)|échantillon]]: soit <center><math>X_1,\ldots,X_n</math></center>
un échantillon de [[Variable_indépendante_et_identiquement_distribuée|variables iid]] à valeurs dans <math>\mathbb{R}</math> avec pour [[fonction de répartition]] ''F''(''x''). La fonction de distribution empirique <math> F_n(x) </math> basée sur l'échantillon <math> X_1,\ldots,X_n</math> est une [[Fonction_en_escalier|fonction en escalier]] définie par
un échantillon de [[Variable_indépendante_et_identiquement_distribuée|variables iid]] à valeurs dans <math>\scriptstyle\ \mathbb{R}\ </math> avec pour [[fonction de répartition]] ''F''(''x''). La fonction de distribution empirique <math>\scriptstyle\ F_n(x)\ </math> basée sur l'échantillon <math> X_1,\ldots,X_n</math> est une [[Fonction_en_escalier|fonction en escalier]] définie par


<center><math>\begin{align}F_n(x)&= \frac{ \mathrm{nombre~d'\acute el \acute ements}\ \leq x\ \mathrm{dans~ l'\acute echantillon}}{n}\\
<center><math>\begin{align}F_n(x)&= \frac{ \mathrm{nombre~d'\acute el \acute ements}\ \leq x\ \mathrm{dans~ l'\acute echantillon}}{n}\\
&= \frac{1}{n} \sum_{i=1}^n I(X_i \le x),\end{align}</math></center>
&= \tfrac{1}{n} \sum_{i=1}^n I(X_i \le x),\end{align}</math></center>


où ''I''(''A'') est la [[fonction indicatrice]] de l'[[Événement_(probabilités)|événement]] ''A''. Le Théorème de Glivenko-Cantelli stipule la convergence uniforme de ''F<sub>n </sub>'' vers ''F''.
où ''I''(''A'') est la [[fonction indicatrice]] de l'[[Événement_(probabilités)|événement]] ''A''. Le théorème de Glivenko-Cantelli stipule la convergence uniforme de ''F<sub>n </sub>'' vers ''F''.


==Énoncé==
==Énoncé==
Ligne 14 : Ligne 14 :
mais il n'en découle pas nécessairement que
mais il n'en découle pas nécessairement que
<center><math>\mathbb{P}\left(\forall x\in \R,\quad\lim_n\ |F_n(x,\omega)-F(x)|=0\right)=1,</math></center>
<center><math>\mathbb{P}\left(\forall x\in \R,\quad\lim_n\ |F_n(x,\omega)-F(x)|=0\right)=1,</math></center>
puisqu'une intersection non dénombrable d'ensembles de probabilité 1 n'est pas nécessairement de probabilité 1. De toute façon on n'aurait alors prouvé que la convergence simple, au lieu de la convergence uniforme stipulée par le théorème de Glivenko-Cantelli.
puisqu'une intersection non dénombrable d'ensembles de probabilité 1 n'est pas nécessairement de probabilité 1. Serait-elle de probabilité 1 qu'on n'aurait alors prouvé que la convergence simple, au lieu de la convergence uniforme stipulée par le théorème de Glivenko-Cantelli.


La preuve du théorème de Glivenko-Cantelli s'apparente à celle du deuxième [[Théorème de Dini#Deuxième théorème|théorème de Dini]], bien qu'ici ''F'' ne soit pas supposée continue.
{{Démonstration|Soit <math>\scriptstyle\ \left(\Omega,\mathcal A,\mathbb P\right)\ </math> l'[[espace probabilisé]] sur lequel les variables aléatoires <math>\scriptstyle\ X_n,\ n\ge 1,\ </math> sont définies. Comme le sont toutes les [[Fonction de répartition#Propriétés caractéristiques|fonctions de répartition]] de [[loi de probabilité]], les fonctions <math>\scriptstyle\ x\to F_n(x,\omega)\ </math> et <math>\scriptstyle\ x\to F(x)\ </math> sont croissantes et continues à droite sur tout <math>\scriptstyle\ \R,\ </math> et par ailleurs elles tendent vers 0 (resp. vers 1) en <math>\scriptstyle\ -\infty\ </math> (resp. en <math>\scriptstyle\ +\infty\ </math>).
Ainsi, pour tout nombre réel ''x'', et pour tout <math>\scriptstyle\ \omega\in\Omega,\ </math> les limites à gauches <math>\scriptstyle\ F_n(x-,\omega)\ </math> et <math>\scriptstyle\ F(x-)\ </math> sont-elles bien définies. De plus, comme
<center><math>\lim_{y\uparrow x} I(X_i(\omega) \le y)\ =\ I(X_i(\omega) < x),</math></center>
on en déduit que :
<center><math>F_n(x-,\omega)\ =\ \tfrac{1}{n} \sum_{i=1}^n I(X_i(\omega) < x).</math></center>
Ainsi, étant la somme de [[Loi de Bernoulli#Variable de Bernoulli|variables de Bernoulli]] indépendantes et de même loi, <math>\scriptstyle\ nF_n(x,\omega)\ </math> (resp. <math>\scriptstyle\ nF_n(x-,\omega)\ </math>) suit une [[loi binomiale]] de paramètres ''n'' et <math>\scriptstyle\ F(x)=\mathbb P(X_i \le x)\ </math> (resp. <math>\scriptstyle\ F(x-)=\mathbb P(X_i < x)\ </math>). De plus, en vertu de la [[loi forte des grands nombres]]<ref>démontrée en 1909 dans le cas qui nous intéresse ici, i.e. le cas des [[Loi de Bernoulli|variables de Bernoulli]] : {{Article
|langue=fr
|prénom1=Émile
|nom1=Borel
|lien auteur1=
|titre=Les probabilités dénombrables et leurs applications arithmétiques
|périodique=Rendiconti del Circolo Matematico di Palermo
|mois=décembre
|année=1909
|volume=27
|numéro=1
|pages=247-271
|issn=0009-725X
|issn2=1973-4409
|doi=10.1007/BF03019651
|url texte=http://www.springerlink.com/content/d82573l5k1n11722/
}}.</ref>, les ensembles
<center><math>A_{x}\ =\ \left\{\omega\in\Omega\ \left|\ \lim_{n}F_n(x,\omega)=F(x)\right.\right\},\quad B_{x}\ =\ \left\{\omega\in\Omega\ \left|\ \lim_{n}F_n(x-,\omega)=F(x-)\right.\right\}</math></center>
sont [[Ensemble négligeable#« Presque sûrement »|presque sûrs]].

Notons ''G'' la [[Fonction de répartition#Théorème de la réciproque|réciproque généralisée]] de ''F'', définie pour <math>\ \scriptstyle x \in]0,1[\ </math> par
<center><math>G(x)=\inf\left\{u\in\mathbb{R}\ |\ F(u)\ge x\right\},</math></center>
et, pour <math>\scriptstyle\ 1\le k\le m-1,\ </math> notons
<center><math>x(k,m)\ =\ G\left(\tfrac km\right)</math></center>
l'image de ''k/m'' par ''G''. Par définition de ''G'', en considérant, successivement, une suite strictement croissante de nombre réels convergeant vers ''x(k,m)'', puis une autre suite, cette fois
strictement ''décroissante'' vers ''x(k,m)'', et en utilisant la continuité à droite de ''F'', on obtient
<center><math>F(x(k,m)-)\ \le\ \frac km\ \le F(x(k,m)),</math></center>
et, par conséquent
<center><math>\begin{align}F(x(k,m)-)-F(x(k-1,m))&\le\ \frac 1m,\\F(x(1,m)-)&\le\ \frac 1m,\\1-F(x(m-1,m))&\le\ \frac 1m.\end{align}</math></center>
Ainsi, pour un nombre réel ''x'' tel que <math>\scriptstyle\ x(k,m)\le x<x(k+1,m),\ 1\le k\le m-2,\ </math> on a successivement
<center><math>\begin{align}F_{n}(x,\omega)-F(x)&\le\ F_{n}(x(k+1,m)-,\omega)-F(x)\\
&\le\ F_{n}(x(k+1,m)-,\omega)-F(x(k+1,m)-)+\tfrac 1m,\\
F_{n}(x,\omega)-F(x)&\ge\ F_{n}(x(k,m),\omega)-F(x)\\
&\ge\ F_{n}(x(k,m),\omega)-F(x(k,m))-\tfrac 1m.\\
\end{align}</math></center>
Si <math>\scriptstyle\ x<x(1,m),\ </math> la première inégalité reste inchangée et la deuxième devient <math>\scriptstyle\ F_{n}(x,\omega)-F(x)\ \ge\ -\tfrac 1m.</math>
Si <math>\scriptstyle\ x\ge x(m-1,m),\ </math> c'est la deuxième inégalité qui reste inchangée, la première devenant <math>\scriptstyle\ F_{n}(x,\omega)-F(x)\ \le\ \tfrac 1m.</math> Quoiqu'il en soit, on en déduit que pour tout réel ''x'',
<center><math>\left|F_{n}(x,\omega)-F(x)\right|\le\ D_{n}(\omega)+\tfrac 1m,</math></center>
où <math>\scriptstyle\ D_{n}(\omega)\ </math> est le supremum de l'ensemble fini :
<center><math>\left\{|F_{n}(x(k,m)-),\omega)-F(x(k,m)-)|,\,|F_{n}(x(k,m)),\omega)-F(x(k,m))|,\ 1\le k\le m-1\right\}.</math></center>
En d'autres termes,
<center><math>\sup_{x\in\R}\left|F_{n}(x,\omega)-F(x)\right|=\|F_{n}(.,\omega)-F(.)\|_{\infty}\le\ D_{n}(\omega)+\tfrac 1m.</math></center>
Posons
<center><math>\Omega_{m}\ =\ \bigcap_{k=1}^{m-1} \left(A_{x(k,m)}\cap B_{x(k,m)}\right).</math></center>
L'ensemble <math>\scriptstyle\ \Omega_{m}\ </math> est [[Ensemble négligeable#« Presque sûrement »|presque sûr]], comme intersection finie d'ensembles [[Ensemble négligeable#« Presque sûrement »|presque sûrs]]. Pour <math>\scriptstyle\ \omega\in\Omega_{m},\ </math>
<center><math>\lim_{n} D_{n}(\omega)=0,</math></center>
donc
<center><math>\limsup_{n} \|F_{n}(.,\omega)-F(.)\|_{\infty}\ \le \ \tfrac 1m.</math></center>
Finalement l'ensemble
<center><math>\bar{\Omega}=\bigcap_{m\ge 1}\Omega_{m}</math></center>
est [[Ensemble négligeable#« Presque sûrement »|presque sûr]], comme intersection dénombrable d'ensembles [[Ensemble négligeable#« Presque sûrement »|presque sûrs]], et pour <math>\scriptstyle\ \omega\in\bar{\Omega},\ </math>
<center><math>\limsup_{n} \|F_{n}(.,\omega)-F(.)\|_{\infty}\ \le \ 0,</math></center>
ou, de manière équivalente,
<center><math>\lim_{n} \|F_{n}(.,\omega)-F(.)\|_{\infty}\ = \ 0.</math></center>
}}
==Notes==
==Notes==
{{Références}}
{{Références}}
Ligne 46 : Ligne 107 :
[[it:Teorema di Glivenko-Cantelli]]
[[it:Teorema di Glivenko-Cantelli]]
[[nl:Stelling van Glivenko–Cantelli]]
[[nl:Stelling van Glivenko–Cantelli]]
[[ru:Теорема ГливенкоКантелли]]
[[ru:??????? ????????????????]]

Version du 4 mars 2011 à 13:24

En Statistiques, une fonction de répartition empirique est la fonction de répartition d'une mesure de probabilités qui attribue la probabilité 1/n à chacun des n termes d'un échantillon: soit

un échantillon de variables iid à valeurs dans avec pour fonction de répartition F(x). La fonction de distribution empirique basée sur l'échantillon est une fonction en escalier définie par

I(A) est la fonction indicatrice de l'événement A. Le théorème de Glivenko-Cantelli stipule la convergence uniforme de Fn vers F.

Énoncé

Théorème de Glivenko-Cantelli[1] —  Presque sûrement, la convergence uniforme a lieu, ou bien, de manière équivalente :

La loi forte des grands nombres, dans le cas de variables aléatoires de Bernoulli, implique que

mais il n'en découle pas nécessairement que

puisqu'une intersection non dénombrable d'ensembles de probabilité 1 n'est pas nécessairement de probabilité 1. Serait-elle de probabilité 1 qu'on n'aurait alors prouvé que la convergence simple, au lieu de la convergence uniforme stipulée par le théorème de Glivenko-Cantelli.

La preuve du théorème de Glivenko-Cantelli s'apparente à celle du deuxième théorème de Dini, bien qu'ici F ne soit pas supposée continue.

Notes

  1. Brémaud, Introduction aux probabilités, page 229.
  2. démontrée en 1909 dans le cas qui nous intéresse ici, i.e. le cas des variables de Bernoulli : Émile Borel, « Les probabilités dénombrables et leurs applications arithmétiques », Rendiconti del Circolo Matematico di Palermo, vol. 27, no 1,‎ , p. 247-271 (ISSN 0009-725X et 1973-4409, DOI 10.1007/BF03019651, lire en ligne).

Bibliographie

  • (en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, Society for Industrial & Applied Mathematics, , 998 p. (ISBN 0898716845 et 978-0898716849)
  • van der Vaart, A.W. and Wellner, J.A. (1996) "Weak Convergence and Empirical Processes", Springer. ISBN 0-387-94640-3.

Modèle:Probabilités et Statistiques