Paradoxe de Saint-Pétersbourg

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le paradoxe de Saint-Pétersbourg se résume à la question suivante : pourquoi, alors que mathématiquement l'espérance de gain est infinie à un jeu, les joueurs refusent-ils de jouer tout leur argent ? Il s'agit donc non d'un problème purement mathématique mais d'un paradoxe du comportement des êtres humains face aux événements d'une variable aléatoire dont la valeur est probablement petite, mais dont l'espérance est infinie. Dans cette situation, la théorie des probabilités dicte une décision qu'aucun acteur raisonnable ne prendrait.

Historique[modifier | modifier le code]

Ce paradoxe a été énoncé en 1713 par Nicolas Bernoulli[1]. La première publication fut publiée par Daniel Bernoulli, “Specimen theoriae novae de mensura sortis”[2] dans les Transactions de l'Académie de Saint-Petersbourg (d'où son nom). Mais cette théorie remonte à Gabriel Cramer dans un courrier privé à Nicolas Bernoulli (neveu) dans une tentative de réponse au paradoxe de Saint-Pétersbourg[3]. Pour ces deux auteurs le joueur refuse de tout miser car il ne peut risquer de perdre tout son argent. Dans cette théorie de l'espérance morale formalisée par Bernoulli, ils introduisent une fonction d'utilité marginale. Cependant ces deux auteurs divergent sur la fonction d'utilité: logarithme naturel pour Bernoulli et racine carrée pour Cramer.

Ces idées sont reprises plus tard par les marginalistes. Puis la théorie de l'espérance morale fut largement débattue dans les années d'après guerre[4]. Des mathématiciens comme Emile Borel jugent cette théorie intéressante sur un point de vue psychologique mais sans intérêt pratique et maintenant 'abandonné'[5] tandis que des économistes s'intéressant à la théorie des jeux développent largement le concept et la fonction utilité. Maurice Allais propose une étude systématique du comportement des agents économiques et souligne la difficulté de définir la rationalité d'un agent économique dans une théorie du risque[6].

Le jeu[modifier | modifier le code]

Soit le jeu de pile ou face suivant: un joueur et une banque. Le joueur parie une mise initiale. La banque encaisse la mise du joueur. On lance une pièce de monnaie. Si face apparaît, la banque paie 1 euro au joueur, et on arrête le jeu. Sinon, on relance la pièce. Si face apparaît, la banque paie 2 euros, et on arrête le jeu. Sinon, on relance la pièce. Si face apparaît, la banque paie 4 euros au joueur, et ainsi de suite. Donc, si face apparaît pour la première fois au n-ième lancer, la banque paie 2^{n-1} euros au joueur. Quelle est la mise initiale du joueur pour que le jeu soit équitable, c'est-à-dire pour que ni la banque ni le joueur ne soient avantagés par ce jeu ? Il faut calculer le gain moyen espéré du joueur au cours d'une partie. Pour que le jeu soit équitable la mise initiale du joueur doit être égale à l'espérance du gain.

Si face intervient dès le premier lancer, on gagne 1 euro. La probabilité pour que cela arrive est ½, ce qui donne une espérance de gain pour ce coup de 1/2× 1=1/2. Si face intervient pour la première fois au 2e lancer, ce qui se produit avec une probabilité de ½×½=1/4, le gain est de 2 euros, ce qui fait une espérance de gain de 1/2 euro pour ce coup. Plus généralement, si face apparaît pour la première fois au n-ième lancer, ce qui se produit avec une probabilité de ½n, le gain est de 2(n-1) euros, d'où une espérance de gain de 1/2 euro pour ce coup.

L'espérance s'obtient en sommant les espérance de gain de tous les cas possibles. On somme une infinité de termes qui valent tous 1/2 : la somme est donc infinie. Le jeu est donc défavorable à la banque dans tous les cas, sauf si la mise initiale était infinie.

Explication du paradoxe[modifier | modifier le code]

Pour mettre en évidence l'aspect paradoxal de ce problème, il faut considérer que, quelle que soit la mise initiale, l'espérance mathématique de gain est positive, et même infinie, pour le joueur. Pourtant, tout quidam soi-disant sain d'esprit refusera de jouer à un tel jeu si la mise initiale est trop élevée. Ce comportement d'apparence irrationnelle est à l'origine de la notion d'aversion au risque. Il a été formalisé sous la forme de fonction d'utilité et a donné naissance à la théorie de la décision[7].

Cependant, face à de tels paradoxes les mathématiciens ne s'appuient pas sur une fonction d'utilité qui expliquerait le comportement humain mais soulignent l'ignorance trop répandue des calculs de probabilités[1]. Pour Emile Borel, « Il y a, à mon avis, un très grand intérêt scientifique et social à ce que les principes fondamentaux du calcul des probabilités soient admis sans restriction par le plus de personnes possible ». L'aversion au risque ne serait que l'expression d'un refus de participer car le jeu est trop complexe.

Cette dernière conclusion est discutable, car l'objectif d'un acteur économique n'est pas toujours de maximiser son espérance de gain. L'espérance n'est qu'un indicateur de valeur moyenne : rien dans la théorie des probabilités n'indique qu'il serait toujours rationnel de jouer à un jeu à espérance de gain net strictement positive. A titre d'illustration, peu de gens souhaitent jouer à un jeu consistant à jouer une fois à pile ou face, amenant un gain de 100.000 euros dans le premier cas et une perte de 99.000 euros dans le second, et ce, bien que l'espérance mathématique du gain net soit de 500 euros. En définitive, la décision de jouer ou de ne pas jouer à un jeu est analogue à la décision d'investir ou non dans un produit financier : elle doit dépendre de la courbe d'indifférence au risque de chaque individu, cette courbe dépendant elle-même de nombreux paramètres, comme par exemple la fortune de départ et le nombre de fois qu'il serait admis de jouer au jeu correspondant. En finance, le ratio de Sharpe illustre que les décisions rationnelles sont fondées sur l'analyse du rapport bénéfice/risque, et non sur la seule analyse du premier de ces deux paramètres.

Formalisation mathématique[modifier | modifier le code]

Soit p_k la probabilité que face apparaisse seulement au bout de k lancers, la probabilité d'avoir (k-1 fois) pile puis face,

p_k=\frac{1}{2}\cdot\frac{1}{2}\dotsb\frac{1}{2}=\frac{1}{2^k}.

L'espérance de gain,

E=\frac{1}{2}\cdot 1+\frac{1}{4}\cdot 2 + \frac{1}{8}\cdot 4 + \cdots =\sum_{k=1}^\infty \frac{1}{2^k}\cdot 2^{k-1} =\sum_{k=1}^\infty {1 \over 2}=\infty.

Montant fini[modifier | modifier le code]

Si on suppose que la banque ne dispose que d'une somme finie, les calculs sont les mêmes. Par exemple, si on suppose qu'elle ne dispose « que » 2N euros, la banque ne pourra pas payer plus si face apparaît au bout de N+1 lancers. Pour obtenir l'espérance de gain moyen on somme toutes les probabilités de gain. L'espérance de gain est maintenant finie.

E \ =\ \sum_{k=1}^N p_k 2^{k-1}+\sum_{k=N+1}^\infty p_k 2^{N}\ =\ \sum_{k=1}^N{1 \over 2}+2^{N} \left(1-\left(1-{1 \over {2^N}}\right)\right)\ =\ {N+2
 \over 2},

Le jeu est équitable si la mise de départ est égale à (N+2)/2 euros. Plus il est défavorable au joueur, moins à la banque.

Fonction d'utilité[modifier | modifier le code]

En introduisant une fonction d'utilité qui ne croit pas trop vite, par exemple u(x)=ln(x), on définit une espérance d'utilité qui est finie,

EU=\sum_{k=1}^\infty p_k u(2^{k-1}) =\sum_{k=1}^\infty {\ln(2^{k-1}) \over {2^k}}= \ln 2 \sum_{k=1}^\infty \frac{k-1}{2^k} = \ln 2 <\infty.

Le choix d'une telle fonction n'est qu'un exemple, couramment utilisé mais qui ne reflète pas vraiment la réalité de l'expérience en question. Si l'utilité d'un euro est de 1, l'utilité de 15 euros est très proche de 15. Ce n'est que pour des valeurs très grandes que l'utilité décroît.

Autres règles[modifier | modifier le code]

Notons que l'espérance de gain est infinie même si les règles du jeu sont légèrement modifiées de façon à apparaître a priori encore plus avantageuses pour la banque. Soit \alpha, \beta fixés, le joueur ne reçoit le gain 2^{k-\alpha} que si face apparait au bout de  k>=\beta lancers, si face apparaît avant le joueur ne touche rien.

E=\sum_{k=\beta}^\infty \frac{1}{2^k}\cdot 2^{k-\alpha} =\sum_{k=\beta}^\infty {1 \over 2^{\alpha}}=\infty.

Notes et références[modifier | modifier le code]

  1. a et b Bernard Bru, Marie-France Bru et Kai Lai Chung, « Borel et la martingale de Saint-Pétersbourg », Revue d'histoire des mathématiques,‎ 1999, p. 181–247 (lire en ligne)
  2. Bernoulli, Daniel; “Specimen theoriae novae de mensura sortis” in Commentarii Academiae Scientiarum Imperialis Petropolitanae 5 (1738)
  3. Cramer, Garbriel; lettre du 21 mai 1728 à Nicolas Bernoulli (neveu) (« excerpted in PDF » (ArchiveWikiwixArchive.isGoogleQue faire ?). Consulté le 2013-08-15).
  4. S.M. Stigler, Statistics on the Table. The History of Statistical Concepts and Methods , Cambridge : Harvard University Press, 1999.
  5. Émile Borel, Probabilité et certitude , 1950, Que sais-je?
  6. M. Allais, « Le comportement de l’homme rationnel devant le risque: critique des postulats et axiomes de l’école Américaine », Econometrica, vol. 21, no 4,‎ 1953, p. 503–546 (JSTOR 1907921)
  7. Arrow, Kenneth J. (1974), "The use of unbounded utility functions in expected-utility maximization: Response", Quarterly Journal of Economics, vol. 88, pp. 136-138.

Ouvrage[modifier | modifier le code]

  • Émile Borel, Probabilité et certitude , 1950, Que sais-je?