Espérance conditionnelle

Un article de Wikipédia, l'encyclopédie libre.

En théorie des probabilités, l'espérance conditionnelle d'une variable aléatoire réelle donne la valeur moyenne de cette variable quand un certain événement est réalisé. Selon les cas, c'est un nombre ou alors une nouvelle variable aléatoire. On parle alors d'espérance d'une variable aléatoire conditionnée par un événement B est, intuitivement, la moyenne que l'on obtient si on renouvelle un grand nombre de fois l'expérience liée à la variable aléatoire et que l'on ne retient que les cas où l'événement B est réalisé. L'espérance de X conditionnée par B se note . On rencontre ce type d'espérance conditionnelle, par exemple, dans le calcul de l'espérance de vie où l'espérance de vie à la naissance est différente de celle obtenue si on a déjà atteint l'âge de 60 ans.

Etant donné deux variables aléatoires, on peut définir l'espérance de X conditionnée par Y. Elle se note et c'est une nouvelle variable aléatoire. Dans le cas où Y est une variable aléatoire discrète, elle est définie comme égale à est la fonction presque partout définie par : . Cependant la démarche mise en œuvre dans le cas discret ne se généralise pas facilement dans le cas où la variable X est conditionnée par une variable aléatoire Y quelconque ou une sous-tribu . Il existe alors une définition plus formelle de la variable aléatoire ou .

L'espérance conditionnelle de X sachant Y est la fonction de Y donnant la meilleure approximation de X quand Y est connu. L’espérance conditionnelle est un concept important en probabilités, notamment utilisé dans des domaines tels l'étude des martingales et du calcul stochastique.

Exemple[modifier | modifier le code]

Un dé à six faces.

On considère le lancer d'un dé équilibré à six faces. On considère la variable aléatoire que l'on note X qui vaut 1 quand le résultat du lancer est pair (autrement dit le dé affiche 2, 4 ou 6), et 0 sinon. On considère aussi la variable Y qui vaut 1 quand le résultat est premier (autrement dit le dé affiche 2, 3 ou 5). Le tableau suivant reporte les valeurs de X et Y.

résultat du lancer 1 2 3 4 5 6
X 0 1 0 1 0 1
Y 0 1 1 0 1 0

L'espérance (non conditionnelle) de A vaut . Par contre :

  • L'espérance de X conditionnée à l'événement Y = 1 vaut .
  • L'espérance de X conditionnée à l'événement Y = 0 vaut .
  • L'espérance de Y conditionnée à l'événement X = 1 vaut .
  • L'espérance de Y conditionnée à l'événement X = 0 vaut .

Espérance conditionnée par un événement[modifier | modifier le code]

Soit B un événement de probabilité non nulle, on définit la probabilité conditionnelle ou comme suit. Pour tout événement A :

Si X est une variable aléatoire discrète d'espérance finie, on définit l'espérance de X sachant B, notée , par[1] :

Si X est une variable aléatoire continue, d'espérance finie et de densité f, l'espérance de X sachant B est définie par

De manière plus générale, si X est une variable aléatoire possédant une espérance, l’espérance de X conditionnée par B est[2] est la fonction indicatrice de B qui est nulle sauf sur B où elle est constamment égale à 1.

Comme il existe une formule des probabilités totales, il existe une formule des espérances totales qui s'exprime ainsi[1]: si (Bi ) est une partition de l'univers formée d'événements de probabilité non nulle, alors :

Espérance conditionnée par une variable[modifier | modifier le code]

Cas discret[modifier | modifier le code]

Soit X une variable aléatoire réelle dont l'espérance est définie et Y une variable aléatoire discrète, pour tout yi tel que l'événement {Y = yi} soit de probabilité non nulle, on peut définir On définit ainsi, presque partout, une fonction dite de régression[3]définie par . On définit aussi une variable aléatoire appelée espérance de X conditionnée par Y et notée .

La formule d'espérance totale s'écrit alors[3]: L'intérêt de cette formule réside dans le fait qu'il n'est plus nécessaire de connaître la loi de X pour calculer son espérance et que les lois de X conditionnées par Y suffisent. La formule d'espérance totale se généralise à tout produit de X par une fonction de Y. Pour toute variable aléatoire f(Y), de la propriété[3] , on peut déduire, en posant , les égalités[4]: et pour tout A de la tribu σ(Y). Ce sont ces dernières propriétés qui inspirent la définition caractéristique de l'espérance de X conditionnée par une variable aléatoire ou une tribu dans le cas général.

Cas absolument continu[modifier | modifier le code]

Si X et Y sont deux variables aléatoires absolument continues de densité conjointe fX,Y et de densités marginales fX et fY, on peut définir la densité conditionnelle de X conditionnée par {Y=y}, fX/Y(.,y) pour tout y tel que fY(y) est non nul, par : Dans le cas où fY(y) est nul, on peut prendre une densité arbitraire pour fX/Y(.,y)[5].

On appelle espérance conditionnelle de X sachant {Y=y} la valeur : On appelle espérance de X conditionnée par Y la variable aléatoire .

Il existe de même une formule de l'espérance totale (ou théorème de l'espérance mathématique conditionnelle) :

Définition générale[modifier | modifier le code]

Pas tout à fait générale[modifier | modifier le code]

On se place dans le cas général d'un espace de probabilité est l'univers, est une tribu et est une mesure de probabilité. Soit une sous-tribu, et soit X une variable aléatoire intégrable. Alors il existe une variable aléatoire Z , -mesurable et intégrable, telle que, pour toute variable aléatoire U bornée et -mesurable,

On note alors

et on appelle espérance de X conditionnellement à , ou X sachant , cette variable aléatoire (ce n'est pas un réel). Cette notation est bien définie car si une autre variable aléatoire Y satisfait aussi cette propriété, alors Y = Z presque sûrement.

Cas particuliers:

Cette définition inclut plusieurs définitions données de manières plus immédiates.

  • On peut définir la probabilité conditionnelle d'un événement A par :
Il s'agit d'une variable aléatoire et non d'un réel.
  • On peut également définir l'espérance conditionnellement à une variable aléatoire, par le biais de la tribu engendrée par cette variable aléatoire :
Dans ce cas, il existe une fonction mesurable telle que, presque sûrement,
  • Si A est un événement, par analogie avec la relation on définit la probabilité conditionnelle de A à l'aide de la relation :
Il s'agit d'une variable aléatoire et non d'un réel.

Définition générale[modifier | modifier le code]

Soit

  • un espace probabilisé
  • un espace de Banach
  • une variable aléatoire Bochner-intégrable
  • une sous-tribu

Espérance conditionnelle de étant donné est l'unique (sauf -ensemble négligeable) et intégrable -mesurable variable aléatoire mesurable avec valeur sur , tel que

pour tous [6],[7].

Dans ce cadre, l'espérance conditionnelle est parfois également notée .

Interprétation[modifier | modifier le code]

Espérance conditionnelle suivant plusieurs sous σ-algèbres: dans cet exemple l'espace de probabilité est l'intervalle [0,1] avec la mesure de Lebesgue. On définit les σ-algèbres suivantes : ; la σ-algèbre générée par la subdivision 0, ¼, ½, ¾, 1; et la σ-algèbre générée par la subdivision 0, ½, 1. Ici l'espérance conditionnelle est effectivement la moyenne sur la plus fine partition de la σ-algèbre.

On peut, dans le cas des variables aléatoires de carré intégrable, interpréter l'espérance conditionnelle d'une variable aléatoire X comme la projection orthogonale de X sur l'espace vectoriel des variables aléatoires -mesurables, et, partant de là, comme la meilleure approximation qu'on puisse donner de la variable X à l'aide d'une variable aléatoire -mesurable. En effet, l'espérance conditionnelle possède la propriété suivante : pour toute variable aléatoire Y intégrable -mesurable,

C'est-à-dire que, parmi les variables aléatoires Y intégrables -mesurables, la plus proche de X (pour la distance induite par le produit scalaire ) est

Pour ce qui est des applications, l'espérance conditionnelle pourra alors s'interpréter, par exemple, comme la meilleure prévision possible de la variable aléatoire X, en fonction de l'information disponible à un moment donné, information encodée par la tribu ou encore comme la meilleure reconstruction du signal original X, après émission, en fonction de la déformation bruitée obtenu à la réception.

Il s'agit en ce sens de l'idée que l'on peut se faire du processus grâce à l'information , non par opposition au cas où l'on ne saurait rien de ce processus (information nulle), mais par rapport au cas où l'on connaitrait parfaitement ce dernier (information infinie). Une information conditionnelle correspond donc bel et bien à une perte d'information !

Propriétés[modifier | modifier le code]

L’espérance conditionnelle possède les propriétés suivantes

  • L’espérance conditionnelle est linéaire :
  • Son espérance vaut :
  • Itération : si
  • Monotonie : Si alors
  • Convergence monotone : si est une suite croissante de variables aléatoires réelles qui converge presque sûrement vers X, alors
Plus généralement, le théorème de convergence dominée et le lemme de Fatou s'appliquent naturellement aux espérances conditionnelles.
  • Indépendance: si X est indépendant de alors
  • Si Z est -mesurable, alors
  • Si X est -mesurable, alors
  • Inégalité de Jensen : si est une fonction convexe et est intégrable, alors

Articles connexes[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. a et b Xavier Chauvet, Formulaire de mathématiques, coll. Les mementos de l'INSEEC, n° 10, p. 30
  2. Anne Philippe et Marie-Claude Viano, Cours de probabilités : Modèles et applications, p.4
  3. a b et c Gilbert Saporta, Probabilités, analyse des données et statistique, Editions TECHNIP, 2011 p.72
  4. Alain Yger, Jacques-Arthur Weil, Mathématiques appliquées L3, Pearson Education France, 2009, p.744
  5. Dominique Foata, Aimé Fuchs, Jacques Franchi, Calcul des probabilités - 3e édition, Dunod, 2012, pp.145-147
  6. Modèle:Ouvrate
  7. Tuomas Hytönen, Jan van Neerven, Mark Veraar et Lutz Weis, Analysis in Banach Spaces, Volume I: Martingales and Littlewood-Paley Theory, Springer Cham, (DOI 10.1007/978-3-319-48520-1)

Lien externe[modifier | modifier le code]

[1] : cours de Centrale Paris de 1re année sur l’espérance conditionnelle