Loi du zéro-un de Kolmogorov

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Ne doit pas être confondu avec loi du zéro-un de Borel.

La loi du zéro-un de Kolmogorov est un théorème de probabilités affirmant que tout événement dont la réalisation dépend d’une suite de variables aléatoires indépendantes mais ne dépend d’aucun sous-ensemble fini de ces variables est soit presque sûrement réalisé, soit presque sûrement non réalisé, c’est-à-dire que probabilité est de 0 ou 1.

De tels événements sont appelés événements queue[réf. nécessaire][1] et forment un ensemble nommé tribu asymptotique. Le théorème se reformule donc sous la forme suivante :

Théorème — La tribu asymptotique associée à une suite de variable aléatoire indépendantes sous une probabilité \mathbf P est \mathbf P-triviale.

Le paradoxe du singe savant, selon lequel un singe tapant au hasard sur une machine à écrire écrira presque sûrement n’importe quel texte donné est un exemple d’application de la loi du zéro-un de Kolmogorov.

La loi de Kolmogorov s'avère souvent très utile pour calculer des probabilités, mais, de façon surprenante, il arrive aussi parfois qu'après avoir réduit (aisément) l'ensemble des valeurs possible d'une probabilité à {0,1}, à l'aide de la loi de Kolmogorov, il soit ensuite difficile de déterminer laquelle de ces deux valeurs est la bonne.

Dénomination[modifier | modifier le code]

À la première publication du théorème, Kolmogorov lui donne le nom « Null- oder Eins-Gesetz[2] », traduit en anglais par « zero-or-one theorem[3] » soit en français « loi zéro-ou-un ». L’on trouve aujourd’hui dans la littérature les appellations « loi zéro-un[4] », « loi du zéro-un[5] » ou encore « loi du zéro-un[5] ». Les noms du théorème en anglais et en allemand se sont diversifiés de la même façon.

L’ajout « de Kolmogorov » est fréquemment fait pour distinguer ce théorème de la loi du zéro-un de Borel (présentant les même variations de nommage), les deux lois étant liées et parfois présentées ensemble[6].

Historique[modifier | modifier le code]

Publication des Grundbegriffe der Wahrscheinlichkeitsrechnung[modifier | modifier le code]

Si les probabilités constituent un objet d’études des mathématiciens depuis les travaux de Girolamo Cardano, Blaise Pascal et Pierre de Fermat au XVIIe siècle, elles relèvent alors, selon Jean Dieudonné, du « mélange de raisonnements d’allure mathématique et de considérations plus ou moins intuitives[7] ». Au fil des siècles, cette approche élémentaire se révèle fructueuse et est d’ailleurs toujours enseignée dans le secondaire ; mais elle atteint ses premières limites au début du XXe siècle : ainsi, le développement de la physique statistique par Ludwig Boltzmann requiert des résultats mathématiques solides et justifie l’énonciation du sixième problème de Hilbert en 1900. Le développement de la mécanique quantique durant la première moitié du siècle vient encore accroître le rôle des probabilités en physique, et par conséquent le besoin de rigueur mathématique.

En 1933, Kolmogorov publie son traité Grundbegriffe der Wahrscheinlichkeitsrechnung (« Fondements de la théorie des probabilités ») en allemand et apporte une réponse partielle au problème. Il propose une axiomatisation de la théorie des probabilités en se basant sur les travaux réalisés par les Français Émile Borel et Henri Lebesgue trente ans plus tôt : lois de probabilités, variables aléatoires et événements sont redéfinis en termes de mesures, fonctions et tribus. Si le corps de l’ouvrage ne comprend aucune démonstration de résultat qui n’ait déjà été énoncé, l’un des grands succès de cette nouvelle théorie est la première preuve de la loi forte des grands nombres annoncée dans les dernières pages, mais non encore publiée[8], et objet de recherches depuis Borel. Ce théorème établit en particulier que la probabilité que la suite des moyennes arithmétiques des n premiers éléments d’une suite de variables aléatoires réelles intégrables indépendantes de même loi converge vers un réel fixé prend la valeur 1 si ce réel est l’espérance commune des variables aléatoire, et 0 dans tous les autres cas[9].

Un autre résultat énoncé concerne la convergence des séries de variables aléatoires : Kolmogorov constate qu’une telle série, dès lors que ses termes sont indépendants, converge avec probabilité 0 ou 1 et propose des conditions suffisantes pour calculer cette probabilité[10]. Enfin, il connaît le résultat, publié par Borel en 1909[11] et aujourd’hui connu en tant que « loi du zéro-un de Borel » affirmant que la limite supérieure d’une suite d’événements indépendants a probabilité 0 ou 1, et proposant une condition nécessaire et suffisante portant sur la convergence de la série des probabilités de ces événements pour se trouver dans l’un ou l’autre des cas — ce résultat est notamment utilisé pour la démonstration originelle de la loi forte des grands nombres.

Énoncé originel du résultat[modifier | modifier le code]

Se basant sur ces constats, Kolmogorov énonce et prouve en annexe à son manuel un résultat général incluant tous les cas précités. Cet énoncé de 1933 est exprimé sous une forme légèrement différente de celle aujourd’hui enseignée. L’énoncé et la démonstration supposent que l’on travaille dans un espace probabilisé (Ω, ℱ, P)

L’on définit pour cela les fonctions de Baire : il s’agit des fonctions obtenues par passages à la limite ponctuelle successifs (récurrence transfinie) à partir des polynômes[12],[13].

Théorème — Soit X := (Xn)nN une suite de variables aléatoires à valeurs dans R, f une fonction de Baire définie sur RN telle que l’événement {f(X) = 0} ne dépende d’aucune sous-suite finie de la forme (Xi)0⩽in pour nN[14]. Alors {f(X) = 0} a probabilité 0 ou 1.

Les hypothèses de ce théorème sont en particulier vérifiées[15] si l’on suppose les variables (Xn)nN mutuellement indépendantes, et si f ne dépend que d’un nombre fini de ses paramètres, c’est-à-dire si f(x) = f(y) dès lors que x et y sont deux suites réelles prenant les mêmes valeurs sauf en un nombre fini d’indices.

Tribu asymptotique[modifier | modifier le code]

Les événements queue sont définis comme l’ensemble des éléments contenus dans la tribu asymptotique (ou tribu queue) associée à une suite de variables aléatoires.

Formellement, soit (\Omega, \mathcal F, \mathbf P) un espace probabilisé, soient (E_n, \mathcal E_n)_{n\in\mathbf N} des espaces mesurables, et pour tout n\in\mathbf N, X_n : \Omega \longrightarrow E_n une variable aléatoire (\mathcal F, \mathcal E_n)-mesurables. La tribu asymptotique est définie comme :

\mathcal T = \bigcap_{n \in \mathbf N} \sigma((X_k)_{k\ge n})

\sigma((X_k)_{k\ge n}) désigne la tribu engendrée par la famille de variables aléatoires X_n, X_{n+1}, \dots.

Cette définition ne dépend ni de la loi des variables X_n, ni même de leur éventuelle indépendance.

De façon plus informelle, il s’agit des événements de \Omega dont la réalisation est déterminée par la valeur des variables X_n, mais qui est indépendant de tout sous-ensemble fini de ces variables aléatoires.

Énoncé moderne[modifier | modifier le code]

Exemples[modifier | modifier le code]

Si les X_n sont des variables aléatoires réelles (\mathbf R étant munie de la tribu des boréliens) les événements A : « la suite (X_n)_{n\in\mathbf N} converge », ou B : « la série \sum_{k=1}^\infty X_k diverge » sont des éléments queue. En effet, d’après le critère de Cauchy, A = \{\forall \varepsilon > 0 \exists k \in \mathbf N, \forall p, q \ge k, |X_p - X_q| \le \varepsilon\}, donc quitte à prendre une suite (\varepsilon_m)_{m\in\mathbf N} décroissant vers 0 et choisir k au-dessus du rang n choisi :

A = \bigcap_{n \in \mathbf N}\bigcap_{m\in \mathbf N}\bigcup_{k\ge n}\bigcap_{p,q\ge k} \{|X_p - X_q|\le \varepsilon_m\}.

D’après la loi du zéro-un de Kolmogorov, ces événements sont donc soit presque sûrs, soit de contraire presque sûr.

Au contraire, l’événement \sum_{k=1}^\infty X_k > 1 n'est pas un événement queue dans le cas général (par exemple en supposant ces variables aléatoires positives), puisqu’il n’est pas indépendant de la valeur de X_1.

Démonstration[modifier | modifier le code]

Supposons les X_n indépendantes ; alors les tribus U_n = \sigma (X_0, \dots, X_{n-1}) et T_n = \sigma ((X_k)_{k\ge n}) le sont aussi.

Si nous notons \mathcal T la tribu asymptotique, alors \forall n \in \mathbf N, \mathcal T \subset T_n ce qui nous assure, pour tout n, l'indépendance de \mathcal T et U_n.

Posons alors \mathcal U, la tribu engendrée par toutes les tribus U_n.

La suite de tribus (U_n)_{n \in \mathbf N} est croissante, donc sa limite \bigcup_{n\in \mathbf N} U_n est un \pi-système qui engendre \mathcal U. Comme \bigcup_{n\in \mathbf N} U_n et \mathcal T sont des tribus indépendantes sous \mathbf P, \mathcal U et \mathcal T le sont aussi par lemme de classe monotone.

Ainsi, pour tous événements A \in \mathcal U et B \in \mathcal T, on a \mathbf P(A \cap B) = \mathbf P(A)\mathbf P(B).

Or comme \mathcal T \subset \mathcal U, pour A = B \in \mathcal T, on obtient \mathbf P(A) = \mathbf P(A)^2

On en conclut que \mathbf P(A) \in  \{0, 1\}.

Équivalent topologique[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Tail events en anglais.
  2. Kolmogorov 1933, p. 60
  3. Kolmogorov 1933 (traduction), p. 69
  4. Jacod et Protter 2003, p. 79
  5. a et b Charpentier et al. 2004, p. 58
  6. Charpentier et al. 2004, p. 56-58
  7. Klein et Sacquin 1998, p. 67. Citation datée de l’année 1977.
  8. Kolmogorov 1933, p. 67, note 9
  9. Kolmogorov 1933, p. 67, note 1
  10. Kolmogorov 1933, p. 67
  11. Borel 1909
  12. Kolmogorov 1933, p. 69, note 2.
  13. De façon équivalente, il est possible de partir des fonctions continues.
  14. C’est-à-dire, que cet événement soit indépendant de tout événement contenu dans les tribus engendrées par ces sous-suites finies de variables.
  15. Kolmogorov 1933, p. 69
  16. Kolmogorov 1933, p. 69–70
  17. C’est-à-dire
    \mathfrak R = \bigcup_{n\in\N} \sigma(X_0, \dots, X_n)
  18. Les variables aléatoires (Xn)nN étant mesurables, ces ensembles sont intersections et réunions finies d’événements de la tribu , donc des événements.
  19. A ∈ σ() avec des notations plus modernes.
  20. est un π-système.

Voir aussi[modifier | modifier le code]

Liens internes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

  • (de) Andreï Nikolaïevitch Kolmogorov, Grundbegriffe der Wahrscheinlichkeitsrechnung, Berlin, Springer, coll. « Ergebnisse der Mathematik und Ihrer Grenzgebiete »,‎ (ISBN 978-3-6424-9596-0), Anhang: Null- oder Eins-Gesetz in der Wahrscheinlichkeitsrechnung, p. 60
    Monographie originelle de Kolmogorov, présentant son axiomatisation de la théorie des probabilités, aujourd’hui universellement adoptée.
    Traduction en anglais : (en) Foundations of the theory of probability (trad. Nathan Morrison), New York, Chelsea Publishing Company,‎ (OCLC 185529381, lire en ligne), Appendix : Zero-or-one Law in the Theory of Probability, p. 69-70
  • Éric Charpentier, Loïc Chaumont, Laurent Mazliak, Marc Yor et al., l’Héritage de Kolmogorov en mathématiques, Paris, Belin, coll. « Échelles »,‎ , 304 p. (ISBN 978-2-7011-3669-1), chap. 3 (« quelques aspects de l’œuvre probabiliste »), p. 58-59
  • Jean Jacod et Philip Protter, l’Essentiel en théorie des probabilités, Paris, Cassini,‎ (ISBN 2-84225-050-8), « Indépendance de variables aléatoires », théorème 10.6, p. 79
    Cours de probabilités de niveau licence et master.
  • Étienne Klein et Yves Sacquin (dir.), Prédiction et probabilité dans les sciences, Éditions frontières,‎ , 159 p. (ISBN 2-86332-232-X, lire en ligne)
  • Émile Borel, « Les Probabilités dénombrables et leurs applications arithmétiques », Rendiconti del Circolo Matematico di Palermo, vol. 27, no 1,‎ , p. 247-271 (ISSN 0009-725X et 1973-4409, DOI 10.1007/BF03019651, lire en ligne).