Fonction de répartition empirique

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En statistiques, une fonction de répartition empirique est une fonction de répartition qui attribue la probabilité 1/n à chacun des n nombres dans un échantillon.

Soit X_1,\ldots,X_n un échantillon de variables iid à valeurs dans \mathbb{R} avec pour fonction de répartition F(x).

La fonction de distribution empirique  F_n(x) basée sur l'échantillon  X_1,\ldots,X_n est une fonction en escalier définie par

F_n(x) = \frac{ \mathrm{nombre~d'\acute el \acute ements~ dans~ l'\acute echantillon} \leq x}{n} = 
\frac{1}{n} \sum_{i=1}^n I(X_i \le x),

I(A) est la fonction indicatrice de l'événement A.

Pour un x fixé, la variable I(X_i\leq x) est une variable aléatoire de Bernoulli, de paramètre p = F(x). Par conséquent, la variable nF_n(x) est distribuée selon une loi binomiale, avec pour moyenne nF(x) et pour variance nF(x)(1 − F(x)).

Propriétés asymptotiques[modifier | modifier le code]

F_n(x)\to F(x) presque sûrement pour un x fixé.
En d'autres termes, F_n(x) est un estimateur non-biaisé de la fonction de répartition F(x).
\sqrt{n}(F_n(x)-F(x))

converge en loi vers une loi normale N(0, F(x)(1 - F(x))) pour un x fixé.

Le théorème de Berry–Esseen procure le taux de convergence.
\|F_n-F\|_\infty\to 0 presque sûrement.
L'inégalité de Dvoretzky-Kiefer-Wolfowitz (en) procure le taux de convergence.
\sqrt{n}\|F_n(x)-F(x)\|_\infty converge en distribution vers la distribution de Kolmogorov, à condition que F(x) soit continu.
Le test de Kolmogorov-Smirnov de goodness-of-fit est basé sur ce fait.
\sqrt{n}(F_n-F), en tant que processus indexé par x, converge faiblement dans \ell^\infty(\mathbb{R}) vers un pont brownien B(F(x)).

Bibliographie[modifier | modifier le code]

  • (en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, Society for Industrial & Applied Mathematics,‎ 4 septembre 2009, 998 p. (ISBN 0898716845 et 978-0898716849)
  • van der Vaart, A.W. and Wellner, J.A. (1996) "Weak Convergence and Empirical Processes", Springer. ISBN 0-387-94640-3.