Paradoxe des deux enveloppes

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En théorie de la décision, le paradoxe des deux enveloppes est un raisonnement probabiliste aboutissant à un résultat absurde. Il en existe plusieurs réfutations, certaines[1] ne faisant d'ailleurs pas appel au calcul des probabilités.

Énoncé[modifier | modifier le code]

Il existe plusieurs variantes du paradoxe. Le plus souvent, il est proposé la situation de décision suivante[2],[3] : deux enveloppes contiennent chacune un chèque. On sait que l'un des chèques porte un montant double de l'autre, mais on n'a aucune information sur la façon dont les montants ont été déterminés. Un animateur propose à un candidat de choisir une des enveloppes, le montant du chèque contenu dans l'enveloppe choisie lui sera acquis. Le paradoxe proprement dit réside dans l'argument qui va suivre : avant que le candidat n'ouvre l'enveloppe choisie, l'animateur lui conseille de changer son choix avec le raisonnement suivant.

Soit M la valeur du chèque dans l'enveloppe choisie. Il y a deux cas possibles:

  • une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus important (donc de valeur 2M) ;
  • une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus petit (donc de valeur M/2).

L'espérance du montant obtenu en changeant d'enveloppe serait alors E_{pr} = 50% * 2M + 50% * M/2 = M + M/4 = 5/4  * M qui est supérieur à M.

Le candidat aurait donc intérêt à changer d'enveloppe, ce qui est absurde puisque les deux enveloppes jouent le même rôle, et que le candidat, n'ayant pas encore ouvert la première, n'a aucun moyen de les distinguer.

Résolutions du paradoxe[modifier | modifier le code]

Calcul d’espérances mathématiques[modifier | modifier le code]

L’espérance mathématique[4] permet de définir sur un grand nombre d’épreuves le gain moyen d’une loi de probabilité [5].

Espérance mathématique associée à chaque enveloppe[modifier | modifier le code]

Afin de déterminer le gain moyen obtenu par le choix d’une enveloppe, on associe à la première enveloppe (resp. la seconde) la variable aléatoire X_1 (resp. X_2).

La loi de probabilité de la variable aléatoire X_1 est l’ensemble des 2 solutions possibles proposées par le jeu ({valeur ; probabilité d’apparition}) : \{M; 50\%\} et \{2M; 50\%\}, M et 2M étant les deux montants possibles proposés par le jeu.

Pour la variable aléatoire X_2, l’ensemble est constitué de façon similaire \{2M; 50\%\} et \{M; 50\%\}.

L’espérance du contenu de l’enveloppe 1 est par définition : E_1 = E(X_1) = 50\%.M+ 50\%.2M= 3/2.M.

Pour l’enveloppe 2, on a de façon similaire : E_2 = E(X_2) =  50\%.2M+ 50\%.M= 3/2.M.

On constate que E_1 = E_2 = 3/2.M, ce qui est logique car les deux enveloppes ont un rôle identique.

Espérance mathématique associée à chaque changement[modifier | modifier le code]

Si l'on change d’enveloppe, par exemple de l’enveloppe 1 à l’enveloppe 2, on obtient l’espérance E_{12} d’obtenir le gain de l’enveloppe 2 moins celui obtenu avec l’enveloppe 1 :  E_{12} = E(X_{2}- X_{1}) = E(X_2) - E(X_1)

Ceci est dû à la propriété de linéarité des calculs d’espérance[4].

On conclut  E_{12} = 0 .

De façon similaire  E_{21} = E_{12} = 0.

Sur un grand nombre d’épreuves, on ne peut pas espérer de gain en permutant les choix des enveloppes.

Espérance mathématique associée à chaque changement (variante) [3][modifier | modifier le code]

Si l’on considère les 2 changements possibles[3] :

  • passer d’un montant M à un montant 2M ;
  • passer d’un montant 2M à un montant M.

On obtient resp. deux gains possibles :

  • le premier est positif de valeur +M avec une probabilité d’apparition de 50% ;
  • le second est négatif de valeur -M avec une probabilité d’apparition de 50%.

Ceci définit une seconde loi de probabilité[5] avec deux solutions possibles (valeur ; probabilité) :  \{ +M; 50\% \} et  \{ -M; 50\% \} .

Cette seconde loi de probabilité a par définition une espérance :  E_{ch} = 1/2.M - 1/2.M= 0 .

E_{ch} montre une façon différente d’écrire le calcul détaillé de  E_{12} ou de  E_{21} .

On vérifie :  E_{ch} = E_{12} = E_{21} = 0 .

L'espérance  E_{ch} aboutit lui aussi à un gain moyen nul.

Espérance mathématique calculée par le présentateur[modifier | modifier le code]

Il est intéressant de voir en quoi le raisonnement de l’animateur aurait un défaut. Celui-ci propose la formule suivante :

E_{pr} = 50\% . 2M_c+ 50\% . M_c/2

M_c est le montant de l’enveloppe choisie. On note que l’on ne connait pas M_c qui vaut soit M, soit 2M.

Par définition de l’espérance mathématique d’une loi de probabilité[5], on obtient de cette formule les deux solutions {valeur ; probabilité d’apparition} : \{ 2M_c ; 50\% \} ; \{ M_c/2 ; 50\% \}.

Pour ces deux solutions, il faut envisager les deux cas possibles M_c= M et M_c= 2M :

  • dans le premier cas, on obtient (2M ; 50%) et (M/2 ; 50%) ;
  • dans le second : (4M; 50%) et (M; 50%).

On constate que les solutions possibles (M/2 ; 50%) et (4M;50%) sont contraires aux hypothèses et invalident le raisonnement du présentateur.

En examinant de plus près la formule du présentateur, ces deux solutions : \{2M_c; 50%\} et \{M_c/2 ; 50%\} définissent une autre loi de probabilité[5]. Ainsi E_{pr} correspond à un autre protocole :

  • ouvrir l’enveloppe choisie,
  • lire son contenu M_c,
  • puis remplacer (avec des probabilités égales) le contenu de la seconde par 2M_c ou M_c/2.

Le présentateur a commis une confusion entre deux lois de probabilité distinctes.

Remarques

Supposons que  E_{12} > 0  . Que se passerait-il si l’on permutait plusieurs fois ? Il faudrait détailler les calculs de E_{121}, E_{1212}, etc. On pourrait conjecturer une impossibilité, par exemple obtenir les deux relations incompatibles E_{121} > E_{12} > 0 et E_{121} = E_1 = 0.

Variables aléatoires[modifier | modifier le code]

Il est cependant possible, en fonction de la modélisation exacte du raisonnement de l'animateur, de considérer que l'erreur réside dans l'interprétation des espérances et non dans leur calcul : David Madore fait ainsi remarquer[1] que si l'on considère qu'il y a deux variables aléatoires, X_1, valant M ou 2M, et correspondant (avec probabilités (1/2 ; 1/2)) au contenu de la première enveloppe, et X_2, valant 2M ou M, et correspondant au contenu de la seconde enveloppe, alors l'espérance de X_1 est égale à celle de X_2 et vaut 3M/2, et cependant l'espérance du rapport X_2/X_1 vaut (2M/M + M/2M) /2 = 5/4 ; l'erreur de raisonnement consiste alors à interpréter ce dernier résultat comme signifiant que X_2 est plus intéressant que X_1 (et donc qu'il faut changer d'enveloppe), alors que la seule conclusion à en tirer est le résultat surprenant, mais nullement paradoxal, que : E(X_2/X_1) = E(X_1/X_2) > 1.

Modifications de l'énoncé[modifier | modifier le code]

Si le candidat est autorisé à consulter le contenu de la première enveloppe, une approche probabiliste à ce problème de décision redevient possible : Keith Devlin (suivant une analyse de Amos Storkey) fait ainsi remarquer que si l'animateur a choisi le contenu des enveloppes selon une règle (probabiliste ou non) connue du joueur, il devient possible de prendre une décision rationnelle d'échange en fonction du contenu de la première enveloppe (par exemple, si la règle propose un choix aléatoire uniforme de valeurs d'enveloppes, de choisir d'échanger si le contenu découvert est inférieur à la moyenne des choix offerts par la règle), et David Madore montre même qu'on peut (si peu vraisemblable que cela paraisse) obtenir une probabilité strictement supérieure à 1/2 de choisir la bonne enveloppe quelle que soit la règle utilisée par l'animateur, et ce sans connaitre celle-ci[1]. Avec une information supplémentaire, l'échange peut procurer un gain.

Références[modifier | modifier le code]

  1. a, b et c Explication du paradoxe par David Madore
  2. (en) [PDF] Albers, Trying to resolve the two-envelope problem
  3. a, b et c Jean-Paul Delahaye, Paradoxes. Rubrique de divertissements mathématiques pour ceux qui aiment se prendre la tête. Paradoxe des deux enveloppes. (lire en ligne)
  4. a et b Espérance mathématique
  5. a, b, c et d Loi de probabilité

Liens externes[modifier | modifier le code]