Coopération-réciprocité-pardon

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La stratégie coopération-réciprocité-pardon, plus connue sous le sigle CRP (traduite de Tit-for-Tat (TFT) en américain) ou « Win-Win » qui se résume mieux par « donnant-donnant » que la traduction littérale « gagnant-gagnant », a d’abord été formalisée par le biomathématicien, psychologue et philosophe Anatol Rapoport[1].

Description[modifier | modifier le code]

En 1974, Anatol Rapoport grâce à des études théoriques et empiriques (en partie avec A.M. Chammah), confirmées par deux tournois gagnés en 1979[2], déduit l'idée que la manière la plus « efficace » de se comporter vis-à-vis d'autrui est de se comporter comme suit :

  1. Attitude de coopération: Dans un premier temps, lorsqu'un individu ou un groupe rencontre un autre individu ou groupe, il a tout intérêt à lui proposer une alliance.
  2. Attitude de réciprocité: Dans un second temps, en vertu de la règle de réciprocité, il convient de donner à l'autre en fonction de ce que l'on en reçoit. Si l'autre aide, on l'aide en retour ; si l'autre agresse, il faut répondre en l'agressant à son tour, au coup suivant, de la même manière et avec la même intensité.
  3. Attitude de pardon: Dans un troisième temps, il faut pardonner et offrir de nouveau la coopération.

Application[modifier | modifier le code]

En 1979, Robert Axelrod, professeur de sciences politiques, organise un tournoi entre logiciels autonomes capables de se comporter comme des êtres vivants. Une seule contrainte : chaque programme devait être équipé d'un sous programme de communication lui permettant de discuter et d'interagir avec ses voisins.

Robert Axelrod reçoit 14 disquettes de programmes envoyés par des collègues universitaires également intéressés par ce tournoi. Chaque programme énonce des lois différentes de comportement (pour les plus simplistes, deux lignes de code de conduite, pour les plus complexes, une centaine), le but étant d'accumuler le maximum de points.

Certains programmes ont pour règle d'exploiter au plus vite leurs voisins, de s'emparer par la force ou la ruse de leurs points, puis de changer rapidement de partenaires pour poursuivre cette accumulation de points.
D'autres essayent de se débrouiller seuls, gardant précieusement leurs points et fuyant tout contact avec ceux susceptibles de les voler. Des règles stipulent : « Si l'autre est hostile, l'avertir qu'il doit modifier son comportement puis procéder à une punition. » Ou encore : « Coopérer puis obtenir des défections-surprise provoquées par un système aléatoire. »

Chaque programme fut opposé 200 fois à chacun des autres concurrents. Celui d'Anatol Rapoport, équipé du comportement CRP (Coopération-Réciprocité-Pardon), domine tous les autres.

Encore plus fort, le programme CRP, placé cette fois au milieu des autres en vrac, s'avère au début perdant devant les programmes voleurs agressifs, mais finit par être victorieux puis même « contagieux »: passé un certain délai, au fur et à mesure que le temps s'écoule, les programmes voisins, constatant qu'il est le plus efficace pour accumuler des points, finissent par aligner leur attitude sur la sienne.

Notes et références[modifier | modifier le code]

  1. Nouvelle encyclopédie du savoir relatif et absolu de Bernard Werber.
  2. Anatol Rapoport : historique (en anglais). http://www.isss.org/lumrapo.htm

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]