Fonction de répartition empirique

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En statistiques, une fonction de répartition empirique est une fonction de répartition qui attribue la probabilité 1/n à chacun des n nombres dans un échantillon.

Soit un échantillon de variables iid à valeurs dans avec pour fonction de répartition F(x).

La fonction de distribution empirique basée sur l'échantillon est une fonction en escalier définie par

I(A) est la fonction indicatrice de l'événement A.

Pour un x fixé, la variable est une variable aléatoire de Bernoulli, de paramètre p = F(x). Par conséquent, la variable est distribuée selon une loi binomiale, avec pour moyenne nF(x) et pour variance nF(x)(1 − F(x)).

Propriétés asymptotiques[modifier | modifier le code]

presque sûrement pour un x fixé.
En d'autres termes, est un estimateur non-biaisé de la fonction de répartition F(x).

converge en loi vers une loi normale N(0, F(x)(1 - F(x))) pour un x fixé.

Le théorème de Berry–Esseen procure le taux de convergence.
presque sûrement.
L'inégalité de Dvoretzky-Kiefer-Wolfowitz (en) procure le taux de convergence.
converge en distribution vers la distribution de Kolmogorov, à condition que F(x) soit continu.
Le test de Kolmogorov-Smirnov de goodness-of-fit est basé sur ce fait.
, en tant que processus indexé par x, converge faiblement dans vers un pont brownien B(F(x)).

Bibliographie[modifier | modifier le code]

  • (en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, Society for Industrial & Applied Mathematics, , 998 p. (ISBN 0898716845 et 978-0898716849)
  • van der Vaart, A.W. and Wellner, J.A. (1996) "Weak Convergence and Empirical Processes", Springer. ISBN 0-387-94640-3.