Système de récompense

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le système de récompense / renforcement est un système fonctionnel fondamental des mammifères, situé dans le cerveau, le long du faisceau médian du télencéphale. Ce système de « récompenses » est indispensable à la survie, car il fournit la motivation nécessaire à la réalisation d'actions ou de comportements adaptés, permettant de préserver l'individu et l'espèce (recherche de nourriture, reproduction, évitement des dangers…)[1].

Plus précisément, le système de renforcement est constitué par trois composantes :

  1. affective, correspondant au plaisir provoqué par les « récompenses », ou au déplaisir provoqué par les « punitions » ;
  2. motivationnelle, correspondant à la motivation à obtenir la « récompense » ou à éviter la « punition » ;
  3. cognitive, correspondant aux apprentissages généralement réalisés par conditionnement[2].

Certains psychotropes, comme l'alcool ou les opioïdes, agissent directement sur ce système quand ils sont ingérés, inhalés ou injectés dans l'organisme. Le dysfonctionnement du système de renforcement[3] serait à l'origine de troubles du comportement (alimentaire[4], affectif[5]…), ou à la dépendance à des substances (psychotropes) et à des situations (jeux d'argent, sexe, jeux vidéo…)[6].

Des expériences ont montré son existence chez le poisson rouge, le marsouin, le pigeon, le rat, le chat, le singe et l'être humain, ce qui suggère qu'il existe chez la plupart des vertébrés, tels les poissons, les oiseaux et les mammifères[7].

Définitions[modifier | modifier le code]

Utiliser la nourriture comme récompense est une technique habituelle pour dresser un animal.
Les médailles sont des récompenses symboliques utilisées pour favoriser les comportements socialement désirables.

Il existe plusieurs mots ou expressions pour désigner le phénomène de la “récompense” : “renforcement”, “conditionnement opérant”, “conditionnement instrumental”, “loi de l'effet”, “système de récompense”, “récompense”, ou “processus de renforcement”. Les définitions de ces termes sont données ci-dessous[7] :

Récompense. Le terme “récompense” désigne deux choses :

  • La situation d'apprentissage, où un comportement devient plus fréquent car il a reçu un stimulus positif (par exemple, un chien saute plus souvent au-dessus d'une barrière si, à chaque fois, il reçoit un morceau de sucre).
  • Le stimulus positif lui-même (le morceau de sucre).

Les mots “récompense” et “punition” sont souvent utilisés car ils sont simples à comprendre. Mais comme ils ont un sens culturel et moral, on utilise également le terme “renforcement”, qui a une signification plus neutre, mais aussi plus générale et plus technique.

Renforcement. Les “renforcements” concernent l'apprentissage de réactions motrices (conditionnement skinnérien, opérant ou instrumental) et l'apprentissage de réactions autonomes (salivation, vomissement, piloérection … qui sont apprises par conditionnement pavlovien ou classique). Le terme “renforcement” désigne deux phénomènes :

  • L'augmentation du comportement ou de la réaction qui a été renforcée (la salivation du chien de Pavlov quand il entend sonner la cloche).
  • Par extension, certains auteurs appellent également “renforcement” la procédure d'apprentissage qui permet l'apparition ou l'augmentation de la réaction (l'association entre la nourriture (stimulus inconditionnel) et le son de la cloche (stimulus conditionnel) ).

On distingue des renforcements positifs et des renforcements négatifs :

  • Les renforcements positifs (ou appétitifs), provoquent la répétition de l'activité qui a déclenché ces renforcements appétitifs. Les renforcement positifs sont, en général, perçus consciemment comme des sensations de plaisir (récompense).
  • Les renforcements négatifs (ou aversifs), provoquent la fuite ou l'évitement de l'activité qui a déclenché ces renforcements aversifs. Les renforcements négatifs sont, en général, perçus consciemment comme des sensations de déplaisir (punition).

Renforçateur. Un renforçateur est le stimulus (récompense ou punition) qui provoque le renforcement. Dans le conditionnement pavlovien (ou classique), le renforçateur est le stimulus inconditionnel (par exemple la nourriture). Dans le conditionnement skinnérien (ou opérant / instrumental), le renforçateur est un stimulus (par exemple une médaille) qui suit le comportement et produit une modification de celui-ci.

Processus de renforcement. L'expression “processus de renforcement” désigne les processus neurobiologiques à l'origine de l'apparition ou de l'augmentation de la réaction qui a été renforcée[8] (par exemple, les processus neurobiologiques qui provoquent l'association entre le son de la cloche et la salivation du chien de Pavlov).

Système de récompense. Le “système de récompense” correspond au regroupement fonctionnel de toutes les structures cérébrales qui participent aux renforcements (aire tegmentale ventrale, noyau accumbens, pallidum ventral, septum latéral, cortex préfrontal …).

Comme l'anglais est, dans les conférences scientifiques, encore plus souvent utilisée que le français, il est possible de rencontrer ces termes techniques en anglais dans des textes français. Voici la correspondance des principaux termes : récompense = reward ; punition = punishment ; renforcement = reinforcement ; renforçateur = reinforcer ; renforcement primaire / secondaire = primary / secondary reinforcement ; renforçateur positif / négatif = positive / negative reinforcer.

Niveau psychologique[modifier | modifier le code]

Ivan Pavlov, pionnier des études sur les conditionnements et les renforcements.
Un des chiens de Pavlov, au Pavlov Museum.

Les recherches en neurosciences ont montré que les récompenses / renforcements correspondent à trois composantes psychologiques, les composantes affective, motivationnelle et cognitive[2] :

  • La composante affective correspond au plaisir ou au déplaisir provoqué par la “consommation” du renforçateur (par exemple, la consommation de la nourriture par le chien de Pavlov). Les principales “récompenses” sont les plaisirs gustatif, sexuel ou somatosensoriel, les principales “punitions” sont la douleur et la peur.
  • La composante motivationnelle correspond à la motivation qui est déclenchée par le renforçateur (la vue et l'odeur de la nourriture pour le chien de Pavlov). C'est soit la perception du renforçateur (nourriture, boisson, partenaire sexuel …) par les organes sensoriels, soit la représentation mentale de ce renforçateur, qui déclenche la motivation ou le désir d'obtenir et de “consommer” la récompense (ou de fuir la punition) :
    • Si le renforçateur est inconditionnel (goût sucré, chaleur, phéromone sexuelle, caresse des zones érogènes …), il s'agit alors d'un stimulus qui active des circuits innés provoquant une motivation également innée.
    • Si le renforçateur est conditionnel (une médaille, un son, un objet, un lieu …), il s'agit dans ce cas d'un stimulus qui réactive l'expérience déjà vécue avec ce renforçateur, ce qui provoque une motivation acquise (ou désir) à “consommer” ou fuir le renforçateur.
  • La composante cognitive correspond aux apprentissages qui permettent l'association entre le renforçateur et la réaction émotionnelle ou comportementale (l'association entre la salivation du chien de Pavlov et le son de la cloche).

Ces trois composantes psychologiques sont distinguées les unes des autres, car elles dépendent de systèmes cérébraux relativement distincts[2].

La motivation et le plaisir (ou le déplaisir) ressenti pour un renforçateur sont modulés par l'état de l'organisme (faim, satiété, fatigue …) et par les préférences (ou les aversions) apprises. Par exemple la nourriture est plus appétissante au début d'un repas qu'à la fin (phénomène d'alliesthésie). La motivation pour la sexualité est faible quand l'organisme est fatigué. Un aliment préféré, dont la dégustation a été suivie d'une forte indigestion, peut ensuite provoquer du dégoût.

À noter par ailleurs que les renforcements ne sont pas toujours des phénomènes conscients. Des renforcements (récompenses ou punitions) peuvent modifier les états émotionnels et les comportements, sans que la personne en soit consciente[2].

Niveau neurobiologique[modifier | modifier le code]

Organisation cérébrale[modifier | modifier le code]

Les différentes structures du circuit des récompenses sont distribuées le long du faisceau médian du télencéphale (MFB) : aire tegmentale ventrale (ATV), amygdale, noyau accumbens, septum et cortex préfrontal.

Au niveau neurobiologique, les recherches menées avant les années 2000 ont permis d'identifier un réseau de structures cérébrales qui sont à l'origine des renforcements :

Depuis les années 2000, de nouvelles recherches ont permis d'identifier deux importantes caractéristiques de ces structures cérébrales des renforcements :

  1. La composante affective des renforcements dépend d'un nombre limité de petites structures, appelées “hotspots” ou “points chauds”, d'un volume d'environ 1 cm3, et localisées dans le noyau parabrachial, le noyau accumbens et le pallidum ventral[9],[10]. Ces trois structures ou “hotspots” sont interconnectées entre elles et intégrées dans le système des “récompenses / renforcements”[8] (voir figure ci-dessous).
Situation et interconnexions des “hotspots” ou “points chauds” à l'origine des récompenses, chez le rat. Ces “hotspots” sont localisés dans le pallidum ventral, et dans les noyaux accumbens et parabrachial.
  1. Le système des “renforcements / récompenses” est similaire chez tous les mammifères, tant au niveau structurel que fonctionnel. Les structures, les connexions entre les structures, les entrées sensorielles et les sorties motrices ont été conservées au cours de l'évolution[8] (voir figure ci-dessous).
Similitude du système cérébral des “renforcements / récompense” chez les différentes espèces de mammifères. La comparaison des structures neurales des renforcements entre le rat et le singe (monkey) met en évidence la conservation de l'organisation du système des récompense. Voir les explications dans le texte ci-dessous.
Légende : Amygdala = Amygdale (en orange) ; Ald = Insula agranulaire dorsale ; Alv = Insula agranulaire ventrale ; c = Central ; CD = Caudal ; LO = Orbital latéral ; m = Médial ; MD = Thalamus médiodorsal (en vert) ; Motor output = Sorties motrices ; Nac = Cœur du noyau accumbens ; OFC = Cortex frontal orbital (en violet) ; rABL = Amygdale basolatérale rostrale ; Sensory information = Entrée des informations sensorielles ; Striatum = Striatum (en rose) ; VO = Orbital ventral ; VP = Pallidum ventral.

En synthèse de toutes ces données, neurobiologiques et psychologiques, le système des “récompenses / renforcements” est organisé de la manière suivante[2],[8] :

  • La composante motivationnelle : c'est la motivation pour obtenir une récompense (ou éviter une punition). Cette composante comprend 2 niveaux :
    • Les processus motivationnels des renforcements, constitués principalement par le système dopaminergique de l'aire tegmentale ventrale. L'activité de ces processus n'est pas toujours consciente.
    • Le désir conscient d'obtenir des récompenses (ou d'éviter une punition).
  • La composante affective : c'est le plaisir provoqué par la récompense / renforcement appétitif (ou le déplaisir provoqué par la punition / renforcement aversif). Cette composante comprend également 2 niveaux :
    • Le “cœur” ou le “noyau” fonctionnel des processus hédoniques des renforcements, constitué par le réseau des “points chauds” (ou “hotspots”). L'activité de ces processus n'est également pas toujours consciente.
    • L'expérience consciente du plaisir de la récompense (ou déplaisant de la punition), qui serait en partie élaborée par les processus cognitifs responsables de la conscience.
  • La composante cognitive : ce sont, basé sur les expériences de renforcements (récompenses ou punitions) déjà vécus, les associations, les représentations et les prédictions concernant les renforcements. Avec également 2 niveaux :
    • Les conditionnements associatifs, qui dépendent principalement de l'amygdale et du cortex préfrontal.
    • Les prédictions conscientes et explicites concernant les futurs renforcements appétitifs ou aversifs (récompenses ou punitions).
Articles connexes : Plaisir et Plaisir sexuel.

Neuromédiateurs[modifier | modifier le code]

Les principaux neuromédiateurs impliqués dans les renforcements sont :

Contrôle hormonal[modifier | modifier le code]

Les processus de renforcement sont en général continuellement actifs.

Mais pour la reproduction, il existe des régulations réalisées par les hormones sexuelles :

  • Chez les rongeurs, les renforcements appétitifs provoqués par la stimulation des mamelles ne sont actifs que durant la période de l'allaitement. Ces renforcements, qui sont plus puissants que ceux induits par la cocaïne, sont à l'origine du comportement d'allaitement[11].
  • Chez les mammifères inférieurs (rongeurs, canidés, ovins …), les renforcements sexuels ne sont actifs que durant la saison sexuelle et la période oestrale chez les femelles.

Mais on observe que les hormones qui contrôlent le comportement sexuel perdent de leur influence au cours de l'évolution. L'influence est forte chez les rongeurs, mais faible chez les primates[12]. Chez l'être humain, les renforcements sexuels sont actifs durant toute l'année, ce qui permet des activités érotiques continues.

Rôle fonctionnel[modifier | modifier le code]

Le système des récompenses / renforcements est actif dès la fin de la gestation. Il permet l'apprentissage de réactions émotionnelles, d'actions motrices et de comportements indispensables à la survie de l'individu et de l'espèce :

  • Le maintien de l'homéostasie.
  • Des apprentissages permettant l'adaptation à l'environnement (mémorisation des emplacements de nourriture ou d'eau, conditionnements aux dangers …).
  • L'apprentissage des comportements fondamentaux, comme le comportement alimentaire, l'allaitement[11],[13],[14] ou le comportement sexuel[15],[16].
Articles connexes : Comportement érotique et Allaitement.


Histoire : découverte des récompenses / renforcements[modifier | modifier le code]

L'étude des renforcements / récompenses a débuté dans les années 1950, par la découverte accidentelle que la stimulation électrique de certaines régions du cerveau provoquait la répétition de l'activité qui déclenchait cette stimulation électrique[17].

En variant l'implantation des électrodes, il est apparu que toutes les structures situées le long du faisceau médian du télencéphale provoquaient des autostimulations, dont la fréquence était de 10 à 100 par minute.

En conclusion de ces premières études, les structures provoquant l'autostimulation ont été considérées comme des “centres du plaisir” et ont été regroupées dans un “système de récompense”. La mise en jeu de ce système devait produire une “récompense” qui incitait l'individu à répéter l'action à l'origine de cette “récompense” cérébrale.


Notes et références[modifier | modifier le code]

  1. KOLB Bryan, WHISHAW Ian Q. Cerveau et comportement, De Boeck Université, 2e édition, 2008.
  2. a, b, c, d et e BERRIDGE KC, ROBINSON TE, ALDRIDGE JW. Dissecting components of reward: 'liking', 'wanting', and learning, Curr. Opin. Pharmacol., 9(1):65-73, 2009.
  3. SALOMON L. , LANTERI C. , GLOWINSKI J. , TASSIN J. P. Behavioral sensitization to amphetamine results from an uncoupling between noradrenergic and serotonergic neurons, Proceedings of the National Academy of Sciences of the United States of America, 103(19):7476-7481, 2006.
  4. BERRIDGE K. C. 'Liking' and 'wanting' food rewards: brain substrates and roles in eating disorders, Physiology & Behavior, 97(5):537-550, 2009
  5. REYNAUD Michel, L'amour est une drogue douce… en général, Robert Laffont, 2005
  6. VALEUR Marc, MATYSIAK Jean-claude. Sexe, passion et jeux vidéo ; les nouvelles formes d'addiction, Flammarion, 2003.
  7. a et b LE NY Jean-François, in BLOCH Henriette & coll. (Dir.), Grand dictionnaire de la psychologie, Larousse 1994.
  8. a, b, c et d BERRIDGE KC, KRINGELBACH ML. Affective neuroscience of pleasure: reward in humans and animals, Psychopharmacology (Berl), 199(3):457-480, 2008.
  9. PECINA S. , SMITH K. S. , BERRIDGE K. C. Hedonic hot spots in the brain, The Neuroscientist, 12(6):500-511, 2006.
  10. PECINA S. , BERRIDGE K. C. Hedonic hot spot in nucleus accumbens shell: where do mu-opioids cause increased hedonic impact of sweetness? The Journal of Neuroscience, 25(50):11777-11786, 2005
  11. a et b FERRIS C. F. , KULKARNI P. , SULLIVAN J. M., Jr. , HARDER J. A. , MESSENGER T. L. , FEBO M. Pup suckling is more rewarding than cocaine: evidence from functional magnetic resonance imaging and three-dimensional computational analysis, The Journal of Neuroscience, 25(1):149-156, 2005
  12. SIGNORET Jean-Pierre, Sexuel (Comportement), Encyclopædia Universalis. Version électronique 11.0, 2006.
  13. STERN J. M. , DIX L. , BELLOMO C. , THRAMANN C. Ventral trunk somatosensory determinants of nursing behavior in Norway rats: 2. Role of nipple and surrounding sensations, Psychobiology, 20(1):71-80, 1992
  14. STERN J. M. , JOHNSON S. K. Ventral somatosensory determinants of nursing behavior in Norway rats. I. Effects of variations in the quality and quantity of pup stimuli, Physiology & Behavior, 47(5):993-1011, 1990
  15. (en) AGMO Anders Functional and dysfunctional sexual behavior Elsevier 2007.
  16. (fr) WUNSCH Serge, Thèse de doctorat sur le comportement sexuel [PDF] EPHE-Sorbonne, Paris, 2007.
  17. OLDS J, MILNER P. Positive reinforcement produced by electrical stimulation of septal area and other areas of the brain. J Comp Physiol Psychol 47:419-427, 1954.

Bibliographie[modifier | modifier le code]

  • (en) Morten L. Kringelbach and Kent C. Berridge, Pleasures of the brain, Oxford University Press, 2009.
  • (en) Jaak Panksepp, Affective Neuroscience: The Foundations of Human and Animal Emotions, New York: Oxford University Press, 1998.
  • (en) Marc Breedlove, Mark Rosenzweig, Neil Watson, Biological Psychology, an introduction to behavioral, cognitive, and clinical neuroscience, 5e édition, Sinauer Associates, 2007.
  • (en) Anders Agmo Functional and dysfunctional sexual behavior Elsevier 2007
  • (fr) Serge Wunsch, Thèse de doctorat sur le comportement sexuel [PDF] EPHE-Sorbonne, Paris, 2007.

Annexes[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]