Équilibre de Nash
Dans la théorie des jeux, l'équilibre de Nash, nommé d'après John Forbes Nash, est un concept de solution dans lequel l'ensemble des choix faits par plusieurs joueurs, connaissant leurs stratégies réciproques, est devenu stable du fait qu'aucun ne peut modifier seul sa stratégie sans affaiblir sa position personnelle.
Sommaire |
Origine de la notion [modifier]
Un jeu est un cadre formel où plusieurs agents décident d'une stratégie, sachant que leur utilité dépend des choix de tous. Avant Nash, la détermination de situation stable n'avait pas de méthode formelle, même si l'existence d'équilibres pour les jeux à somme nulle et à deux joueurs était connue depuis 1926, via le théorème du minimax de von Neumann. Quoique la traduction courante d'un équilibre de Nash puisse paraître simpliste, les considérables possibilités qu'il a ouvertes lui ont mérité le « Prix Nobel » d'économie en 1994, qu'il a reçu conjointement à Reinhard Selten et John Harsanyi.
Cette définition s'applique à des jeux avec n'importe quel nombre de joueurs. Nash a démontré que tous les résultats trouvés avant lui conduisaient à des équilibres stables à son sens.
Théorème [modifier]
Théorème de Nash — Soit
un jeu discret où
est le nombre de joueurs et
est l'ensemble des possibilités pour le joueur
, et soit
l'extension de
aux stratégies mixtes. Alors le jeu
admet au moins un point d'équilibre.
On applique le théorème du point fixe de Brouwer ou le théorème du point fixe de Kakutani pour une fonction bien choisie (à développer).
Explication [modifier]
Par exemple, le jeu pierre-papier-ciseaux n'admet pas d'équilibre avec des stratégies pures[1] (si on choisit à toutes les parties « pierre » par exemple, l'autre personne augmentera son gain (la fonction
) en choisissant « feuille ». Mais alors le premier joueur choisira ensuite « ciseau », etc. On n'arrivera jamais à un équilibre). En revanche, si on étend ce jeu aux stratégies mixtes, il y a un point d'équilibre d'après le théorème de Nash[2] (et on peut montrer qu'il est unique). Ce point est donné en choisissant 1⁄3 « pierre » + 1⁄3 « ciseau » + 1⁄3 « papier », c'est-à-dire, du point de vue probabiliste, de jouer avec une probabilité 1⁄3 chacune des trois possibilités.
Optimalité [modifier]
L'existence d'un équilibre n'implique pas que celui-ci soit nécessairement optimal. Il peut en effet exister d'autres choix des joueurs qui conduisent, pour chacun, à un gain supérieur.
Ces choix peuvent, ou non, correspondre à un autre équilibre (le théorème de Nash dit qu'il existe au moins un équilibre, mais pas qu'il est unique).
Considérons, par exemple, un jeu où deux joueurs choisissent simultanément un nombre de 2 à 12. Le joueur qui a annoncé le plus petit nombre remporte ce nombre, l'autre joueur gagne la même chose moins deux. En cas d'égalité, les deux joueurs subissent la pénalité de deux.
Les seuls équilibres de Nash de ce jeu sont quand les deux annoncent 2, ou quand l'un annonce 2 et l'autre 3. En effet, dans toutes les autres paires de stratégies : si le plus petit est 3 ou plus, le joueur qui annonce plus ou autant peut améliorer son résultat en déclarant le plus petit moins un. Si le plus petit est 2 et l'autre est 4 ou plus, le joueur qui a choisi le plus petit peut améliorer son score en choisissant le plus grand moins un.
Dans le choix (2,2) si quelqu'un change il n'aura pas mieux que 0 de toute façon. Dans (2,3) si celui qui a choisi 3 change il n'aura pas mieux que 0, si celui qui a choisi 2 change il aura 1 au lieu de 2, donc ce sont des équilibres de Nash. Cependant, il est clair que le choix (12,12), rapportant 10 à chaque joueur, est bien meilleur pour les deux que les équilibres précédents.
D'autres exemples célèbres sont ceux du problème des marchands de glaces ou du dilemme du prisonnier.
Les exemples d'équilibre non-optimaux sont parfois évoqués pour montrer que si chaque acteur économique raisonne individuellement selon son intérêt, alors il peut en résulter une situation pire que si les acteurs se concertaient[3].
Unicité [modifier]
Tout jeu peut avoir de nombreux équilibres de Nash ou aucun (c'est le cas du jeu consistant à écrire simultanément un entier, le gagnant étant celui dont l'entier est le plus grand). Néanmoins, Nash est parvenu à démontrer que tout jeu avec un nombre fini de joueurs ayant un nombre fini de stratégies admet au moins un équilibre de Nash en stratégie mixte (c'est-à-dire si l'on considère comme une stratégie possible de tirer aléatoirement (avec des probabilités fixées) entre plusieurs stratégies).
Dans le cas d'un jeu à somme nulle à deux joueurs, c'est-à-dire où ce que gagne un joueur est nécessairement perdu par l'autre, ce résultat (c’est-à-dire l'utilité induite par tout équilibre) est nécessairement unique. Il a conduit à définir la valeur d'un jeu.
Limites et perspectives [modifier]
L'équilibre de Nash est limité dans la réalité par la faculté qu'ont les agents de se coordonner et de répéter leurs choix.
Communication et négociation [modifier]
L'équilibre de Nash définit des situations d'équilibre très stables, mais — comme on l'a vu — non nécessairement optimales. La notion est pertinente dans le cas d'agents isolés, ou d'une population trop nombreuse pour se coordonner, en présence d'options limitées et peu nombreuses.
À l'inverse, dans le cas d'interactions négociées ou encastrées dans un milieu social qui permettent la communication, donc la coordination, l'équilibre de Nash est rompu à moins d'aggraver le jeu par l'intervention d'autres variables qui viendraient limiter les choix et les intérêts des agents, ou encore par l'adoption de modèles d'anticipation ou de confiance des agents en la négociation.
Équilibre évolutionnairement stable [modifier]
Les applications des jeux répétés et en particulier l'isolement d'un comportement altruiste optimal dans des cas particuliers de dilemme du prisonnier ont intéressé les biologistes. Ce résultat a permis de combler un trou conceptuel dans l'évolutionnisme, qui paraissait privilégier l'égoïsme.
Les théoriciens ont donc défini une forme plus exigeante d'équilibre pour des modèles répétés : un équilibre évolutionnairement stable reste stable même en cas de comportement légèrement perturbé. Cette stabilité vise à couvrir les situations d'apparition de nouveaux comportements dans une population, c'est-à-dire de dépasser l'immobilisme présumé par Nash..
Anecdote [modifier]
Dans l'adaptation au cinéma de la biographie de Nash, Un homme d'exception, la découverte de cet équilibre est mise en scène par une stratégie de séduction.
- Quatre camarades de Nash souhaitent séduire une fille parmi les 5 présentes.
- Nash leur explique que s'ils suivent individuellement leur intérêt, ils tenteront tous les 4 de séduire la plus belle. Ils vont alors se court-circuiter et essaieront, par la suite, de se reporter sur l'une des quatre restantes. Mais « personne n'aime être un second choix », leur stratégie est donc vouée à l'échec.
- La meilleure stratégie serait donc de s'entendre pour séduire chacun l'une des quatre autres filles évitant, de ce fait, tout court-circuit. Ils augmenteront ainsi considérablement leurs chances de succès.
Nash en déduit que la théorie de la main invisible de Smith est lacunaire. Ce à quoi ses camarades rétorquent qu'il ne s'agit là que d'une stratégie destinée à lui permettre de séduire la plus belle.
Cette situation ne semble pas être un exemple d'équilibre de Nash, puisque chaque individu est tenté de tricher pour avoir la plus belle à lui seul. Donc, il y a ici un point focal (la belle) qui empêche de garder l'équilibre en prétendant aller séduire seulement les autres filles. Cependant, si on suit le raisonnement de Nash à la lettre, et si toute tentative de conquérir la belle à deux amène à un échec total (perte de la belle et des « seconds choix »), alors, de fait, l'ensemble des stratégies qu'il propose est un équilibre ; il convient seulement de remarquer qu'il en existe quatre autres, tous aussi valables... D'autre part, on ne peut pas en déduire que le théorie de la main invisible est lacunaire, car bien que les 4 camarades vont se court-circuiter, ici la concurrence n'est un échec que parce que la belle peut n'en choisir aucun.
Voir aussi [modifier]
Articles connexes [modifier]
- Jeu sous forme normale
- Autorégulation
- Équilibre de la terreur
- Jeu à somme non nulle et jeu à somme nulle
- Équilibre parfait en sous-jeux
- Théorie des jeux
- Optimum de Pareto
- Théorème de Sonnenschein
- Jeux types
- Le dilemme du prisonnier, archétype de l'équilibre de Nash sous-optimal
- Le jeu pierre-papier-ciseaux, qui introduit naturellement les stratégies mixtes
- Le problème du rendez-vous ou l'art de la coordination
- Le jeu des dix pièces ou un cas étonnant de théorie des jeux expérimentale
- L'algorithme de Lemke est un algorithme qui permet de trouver des équilibres de Nash.
- Extensions de la notion
- Une stratégie évolutionnairement stable supporte les chocs extérieurs
- Le principe de Wardrop étend la notion aux jeux avec trop de joueurs pour assurer une coordination
- Le concept de rationalisabilité étend celui d'équilibre de Nash en imposant aux joueurs des contraintes moins fortes.
Liens externes [modifier]
- (fr) Murat Yildizoglu, Introduction à la théorie des jeux
Notes et références [modifier]
- Une stratégie pure consistant ici à se fixer sur uniquement pierre, ciseaux ou papier.
- En fait, ce résultat est déjà assuré par le théorème du minimax
- Bernard Maris, Anti-manuel d'économie, Bréal, 2003