Ceci est une version archivée de cette page, en date du 19 mars 2020 à 20:51 et modifiée en dernier par Kelam(discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
Dans la théorie des probabilités, il existe différentes notions de convergence de variables aléatoires.
La convergence (dans un des sens décrits ci-dessous) de suites de variables aléatoires est un concept important de la théorie des probabilités utilisé notamment en statistique et dans l'étude des processus stochastiques.
Par exemple, la moyenne de n variables aléatoires indépendantes et identiquement distribuées converge presque sûrement vers l'espérance commune de ces variables aléatoires (si celle-ci existe).
Ce résultat est connu sous le nom de loi forte des grands nombres.
Dans cet article, on suppose que (Xn) est une suite de variables aléatoires réelles, que X est une variable aléatoire réelle, et que toutes ces variables sont définies sur un même espace probabilisé.
Soient F1, F2, ... la suite des fonctions de répartition
associées aux variables aléatoires réelles X1, X2, ..., et F la fonction de répartition
de la variable aléatoire réelle X. Autrement dit, Fn est définie par Fn(x) = P(Xn ≤ x), et F par F(x) = P(X ≤ x).
La suite Xn converge vers Xen loi, ou en distribution, si
Puisque F(a) = P(X ≤ a), cela signifie que la probabilité que X appartienne à un certain intervalle est très similaire à la probabilité que Xn soit dans cet intervalle pour n suffisamment grand. La convergence en loi est souvent notée
ou encore
La convergence en loi est la forme la plus faible au sens où, en général, elle n'implique pas les autres formes de convergence définies ci-dessous, alors que ces autres formes de convergence impliquent la convergence en loi.
C'est ce type de convergence qui est utilisé dans le théorème central limite.
De manière équivalente, la suite (Xn) converge en loi vers X si et seulement si pour toute fonction continue bornée
Autrement dit, (Xn) converge en loi vers X si et seulement si la fonction caractéristique de la variable aléatoire réelle Xnconverge simplement vers la fonction caractéristique de la variable aléatoire réelle X.
Exemple : théorème central limite :
La moyenne d'une suite de variables aléatoires centrées et de carré intégrable, indépendantes et de même loi, une fois renormalisée par √n converge en loi vers la loi normale
Dans ce cas, on peut aussi utiliser le lemme de Scheffé, qui est un critère de convergence d'une suite de variables aléatoires à densité vers une variable aléatoire à densité.
Exemple : loi dégénérée :
La suite[1] converge en loi vers une variable aléatoire X0 dite dégénérée, qui prend une seule valeur (0) avec probabilité 1 (on parle parfois de masse de Dirac en 0, notée δ0) :
Convergence en probabilité
Définition —
Soit (Xn)n une suite de variables aléatoires réelles définies sur un même espace de probabilité . On dit que Xn converge vers Xen probabilité si
On note parfois
ou encore
Lemme —
Si l'on a les convergences suivantes, respectivement dans (E,d) et dans
alors on a
dans l'espace E × E muni de la distance infinie.
Démonstration
Soit F un fermé de E × E. Pour tout ε > 0 on note
Alors
En passant au limsup on obtient, en utilisant les deux hypothèses et le 3e point du théorème porte-manteau
puis en faisant tendre ε vers 0, comme F est fermé
On conclut en utilisant à nouveau le 3e point du théorème porte-manteau.
Propriété —
Si Xn converge vers Xen probabilité alors Xn converge vers Xen loi.
Démonstration
C'est une conséquence du lemme précédent en prenant Xn = X et en remarquant que la convergence en loi
dans équivaut à la convergence en probabilité
dans (E,d).
Sinon, on peut procéder comme suit. Commençons par énoncer un lemme.
Lemme —
Soient X, Y des variables aléatoires réelles, c un réel et ε > 0. Alors
En effet, il suffit de remarquer que :
L'inégalité en découle naturellement.
Pour tout ε > 0, en raison de ce lemme, on a :
On a donc
Soit a un point de continuité de FX.
On fixe un réel ε' > 0.
Par continuité de FX en a, il existe un réel ε > 0 tel que
.
De la convergence de (Xn)n en probabilité vers X, on peut en déduire l'existence d'un entier N tel que : si n ≥ N.
D'où : .
Théorème de Slutsky — Si Xnconverge en loi vers X, et si Yn converge en probabilité vers une constante c, alors le couple (Xn ,Yn) converge en loi vers le couple (X,c).
Définition —
Soient r > 0 et (Xn)n une suite de variables aléatoires réelles définies sur un même espace de probabilité . On dit que Xn converge vers Xen moyenne d'ordre r ou en norme Lr si pour tout n et si
Convergence d'une fonction d'une variable aléatoire
Un théorème très pratique, désigné en anglais généralement sous le nom de mapping theorem(en), établit qu'une fonction gcontinue appliquée à une variable qui converge vers X convergera vers g(X) pour tous les modes de convergence :
Théorème — (Mapping theorem[2]) Soit une fonction continue en tout point d'un ensemble C tel que :
On sait alors par le continuous mapping theorem que l'estimateur de l'écart typeσ = √σ2 est convergent, car la fonction racine est une fonction continue.
Implications réciproques
Pour récapituler, on a ainsi la chaîne d'implication entre les différentes notions de convergence de variables aléatoires :
La convergence en probabilité n'implique ni la convergence dans , ni la convergence presque sûre, comme le montre l'exemple suivant :
Exemple :
Soit r > 0. On considère (Xn)n ≥ 1 une suite de variables aléatoires indépendantes telle que
La suite (Xn)n converge en probabilité vers 0 car
En revanche, elle ne converge pas dans car
Montrons qu'elle ne converge pas non plus presque sûrement. Si c'était le cas sa limite presque sûre serait nécessairement sa limite en probabilité, à savoir 0. Or, comme et comme les variables aléatoires Xn sont indépendantes, on a par la loi du zéro-un de Borel :
i.e. presque sûrement Xn = n1/r pour une infinité de n. Donc, presque sûrement, A fortiori Xn ne converge pas presque sûrement vers 0.
Exemple :
Dans l'exemple précédent, pour éviter le recours à la loi du zéro-un de Borel, on peut définir explicitement la suite Xn de la façon suivante. On choisit Ω = [0 ; 1] muni de sa tribu borélienne et de la mesure de Lebesgue. On pose , pour , puis
Enfin on définit
Les Xn ainsi définis ne sont pas indépendants mais ils vérifient comme dans l'exemple précédent
À quelques exceptions près, ces implications n'ont pas de réciproque, à proprement parler. Voici toutefois quelques propriétés utiles qu'on pourrait qualifier de « semblants de réciproques » :
Si Xn converge en loi vers une constante réelle c, alors Xn converge en probabilité vers c.
Si Xn converge en probabilité vers X, alors il existe une sous suite qui converge presque sûrement vers X.
Si Xn converge en probabilité vers X, et si pour tout n et un certain b, alors Xn converge en moyenne d'ordre r vers X pour tout r ≥ 1}. Plus généralement, si Xn converge en probabilité vers X, et si la famille (Xp n) est uniformément intégrable, alors Xn converge en moyenne d'ordre p vers X.
Si pour tout ε > 0,
alors Xn converge presque sûrement vers X. En d'autres termes, si Xn converge en probabilité vers X suffisamment rapidement (i.e. la série ci-dessus converge pour tout ε > 0), alors Xn converge aussi presque sûrement vers X. Cela résulte d'une application directe du théorème de Borel-Cantelli.
Soit (Xn)n ≥ 1 une suite de variables aléatoires réelles indépendantes. Pour tout n, on pose :
.
Alors la convergence presque sûre de la suite (Sn)n ≥ 1 équivaut à sa convergence en probabilité ; autrement dit, la convergence presque sûre de la série de terme général Xn équivaut à sa convergence en probabilité.