Jeu sous forme normale

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En théorie des jeux, un jeu sous forme normale est la spécification de l'espace des stratégies et des fonctions de paiement de chaque joueur à toutes les étapes possibles du jeu.

Définition mathématique[modifier | modifier le code]

Définitions préliminaires[modifier | modifier le code]

La forme normale est employée pour décrire des jeux à nombre de coups, de joueurs et de stratégies finis.

  • Soit donc un ensemble fini de joueurs J  = \{1, 2, ...,m\}.
  • Chaque joueur k peut employer un nombre fini de stratégies pures choisies dans l'ensemble
 S_k = \{s_{k,1},  s_{k,2} ,  ..., s_{k,m_k} \}.
 \mathbf{S} =  S_1 \times S_2 \times \ldots \times S_m
  • Un profil de stratégies est alors le m-uplet :
 \vec{s} = (s_1, s_2, \ldots,s_m)\in \mathbf{S}
  • Une fonction de paiements est une fonction F :
 F: \mathbf{S} \rightarrow \mathbb{R},
une telle fonction est donnée pour chaque joueur, elle s'interprète comme le gain, éventuellement mesuré en termes d'utilité.
  • Soit enfin la fonction:
 \mathbf{F} : \mathbf{S} \rightarrow \mathbb{R}^m,
telle que
 \mathbf{F} = (F_1, F_2, \ldots, F_m)
F_k désigne la fonction de paiements du joueur k.

Jeu sous forme normale[modifier | modifier le code]

Avec les définitions du paragraphe précédent, la forme normale d'un jeu est alors la donnée du (2m+1)-uplet

 (J, S_1,S_2, \ldots,S_m, F_1, F_2, \ldots, F_m)

ou encore

 (J, \mathbf{S}, \mathbf{F})

Jeux infinis[modifier | modifier le code]

Les définitions données ci-dessus sont également valables pour les jeux comportant un nombre infini de joueur ou de stratégies possibles. Toutefois, leur étude demande des outils d'analyse fonctionnelle qui ne sont pas requis en théorie des jeux finis.

Stratégies mixtes en forme normale[modifier | modifier le code]

Avec le profil de stratégies mixtes[modifier | modifier le code]

Il est possible d'intégrer la possibilité de stratégies mixtes dans un jeu en forme normale.

On suppose alors que chaque joueur associe une probabilité Pr_k à chaque élément de S_k :

\operatorname{Pr}_k={\operatorname{Pr}_k(1),  \operatorname{Pr}_k(2), \ldots, \operatorname{Pr}_k(n_k)}.

Un profil de stratégies mixtes est alors la donnée des 
\operatorname{Pr}_k, k \in {1,2,\ldots,m}.

Avec la fonction de paiements[modifier | modifier le code]

L'espace \sigma des profils de stratégies est alors un espace probabilisé tel que :

 \operatorname{Pr}(\vec{\sigma} = (\sigma_1, \sigma_2, \ldots,\sigma_m))=\operatorname{Pr}_1(\sigma_1) \times\operatorname{Pr}_2(\sigma_2) \times \cdots \times \operatorname{Pr}_m(\sigma_m) .

La fonction de paiements est alors une variable aléatoire sur (\Sigma,\operatorname{Pr}). On en considère alors l'espérance selon \operatorname{Pr}.

Matrice des gains[modifier | modifier le code]

Article détaillé : matrice des gains.

Définition[modifier | modifier le code]

Quand il n'y a que deux joueurs et un nombre suffisamment restreint de stratégies, il est possible de donner la forme normale d'un jeu sous la forme d'un tableau à m lignes et n colonnes, où m et n sont le nombre de stratégies à la disposition du joueur, représentées respectivement en ligne et en colonne. Les cases du tableau sont alors remplies avec un doublet donnant les paiements pour chaque joueur si le résultat du jeu est la paire de stratégies correspondant à la ligne et à la colonne de la case considérée.

Exemple[modifier | modifier le code]

Considérons le jeu connu sous le nom de dilemme du prisonnier. Les deux joueurs sont deux criminels, entendus en même temps, séparément l'un de l'autre et sans possibilité de communiquer à propos d'un crime commis en commun. Chaque prisonnier peut soit nier le crime (C, pour coopérer), soit plaider coupable et servir de témoin à charge contre son complice (D, pour dévier). Le résultat de chaque stratégie en nombre d'années de prison est comme suit :

(C) (D)
(c) 1,1 20,0
(d) 0,20 10,10

Le premier prisonnier (Ligne) peut donc choisir de coopérer ou de dévier. De même, le deuxième prisonnier (Colonne) peut choisir entre coopérer et dévier. Si les deux coopèrent, ils écopent d'un an de prison chacun. S'ils dévient tous les deux, ils écopent de dix ans chacun. Si Ligne coopère et que Colonne dévie, Colonne est libéré, et Ligne prend vingt ans de prison. Inversement, si Ligne dévie et Colonne coopère, Ligne est libre et Colonne en prend pour vingt ans.