Théorème — Presque sûrement, la fonction de répartition empirique converge uniformément vers la fonction de répartition , ou bien, de manière équivalente :
La fonction de répartition peut s'écrire comme une moyenne de variables aléatoires de Bernoulli, i.e.
puisqu'une intersection non dénombrable d'ensembles de probabilité 1 (ensembles presque sûrs) n'est pas nécessairement de probabilité 1. Cette intersection serait-elle de probabilité 1 qu'on n'aurait alors prouvé que la convergence simple, au lieu de la convergence uniforme énoncée par le théorème de Glivenko-Cantelli.
Le théorème de Donsker et l'inégalité DKW précisent le théorème de Glivenko-Cantelli en donnant des indications sur la rapidité de convergence, qui est de l'ordre de
Cette preuve utilise le deuxième théorème de Dini[2]. Pour une preuve combinatoire faisant intervenir des inégalités de concentration, voir la preuve des classes de Glivenko-Cantelli. La loi forte des grands nombres nous assure que pour tout converge presque-sûrement vers et de plus est croissante pour tout . Néanmoins quelques problèmes se posent pour appliquer ce théorème :
La fonction de répartition n'est pas nécessairement continue ;
La convergence n'a pas lieu sur un segment ;
La loi forte des grands nombres nous donne une convergence sur un ensemble qui dépend de , i.e.
Pour pouvoir appliquer le second théorème de Dini, il faudrait que
Soient des variables i.i.d. uniformes sur alors la fonction de répartition inverse vérifie la propriété [3]. Alors
Il suffit donc de montrer que le théorème de Glivenko-Cantelli est vrai dans le cas de variables aléatoires uniformes sur . Grâce à la loi forte des grands nombres, on a que :
Il faut donc trouver un ensemble de mesure pleine qui soit uniforme pour tous les . Comme est dénombrable et que l'intersection dénombrable d'ensembles de mesure pleine étant de mesure pleine, on en déduit que :
Montrons que la propriété reste vraie pour tout : soit et alors on se donne une suite croissante et décroissante appartenant à et de limite . Alors pour fixé et :
d'où, en faisant tendre ,
et on conclut en faisant tendre .
On a donc montré que
sur . La convergence est uniforme par le deuxième théorème de Dini.
On pose des variables i.i.d. à valeurs dans un espace de loi et une classe de fonctions définies sur à valeurs réelles. La classe est appelée classe de Glivenko-Cantelli si elle vérifie
avec la mesure empirique définie par et . Le théorème de Glivenko-Cantelli revient donc à dire que la classe des fonctions indicatrices est une classe de Glivenko-Cantelli.
(en) A. W. van der Vaart et J. A. Wellner, Weak Convergence and Empirical Processes : With Applications to Statistics, Springer, , 508 p. (ISBN978-0-387-94640-5, lire en ligne)