Modèle Rescorla-Wagner

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le modèle Rescorla–Wagner est une modélisation mathématique du conditionnement classique. Créé par Robert A. Rescorla (de l'université de Pennsylvanie) et Allan R. Wagner (de l'université Yale) en 1972, il simule un processus d'apprentissage dit pavlovien.

Usage scientifique[modifier | modifier le code]

Bien que souvent critiqué depuis sa création, le modèle Rescorla-Wagner a aussi été très souvent utilisé par les spécialistes de l'apprentissage. Il bénéficie notamment des avantages suivants[1] :

  1. il permet de générer des prédictions claires
  2. un certain nombre de prédictions qu'il a générées ont été confirmées par l'expérience
  3. modéliser la représentation d'un événement par l'intensité et la surprise semble avoir un intérêt intuitif
  4. il a une forte valeur heuristique
  5. il n'a que peu de variables indépendantes
  6. aucun concurrent issu d'une autre théorie ne l'a supplanté.

Principes de base du modèle[modifier | modifier le code]

  1. La valeur de la surprise qu'un organisme expérimente lorsqu'il rencontre un stimuli inconditionné (SI) dépend de la somme des valeurs associatives de tous les stimulus présents durant l'essai. Ce principe rend le modèle Rescorla-Wagner différent de modèles plus anciens qui considéraient uniquement la valeur associative d'un stimulus conditionné (SC) particulier comme aspect déterminant de la surprise.
  2. L'excitation et l'inhibition constituent deux éléments opposés. Un stimulus ne peut avoir qu'une force associative positive ou négative. Dans le premier cas, c'est un excitant conditionné, dans le second c'est un inhibiteur conditionné. Il ne peut jouer les deux rôles à la fois.
  3. La force associative d'un stimulus est exprimée directement dans le comportement qu'il excite ou inhibe. Comprendre l'effet d'un stimulus, c'est comprendre comment il a affecté les réactions de l'organisme.
  4. La salience d'un SC est une constante. Elle n'est pas supposée varier au cours l'apprentissage.
  5. L'histoire d'une réponse n'a aucun effet sur son état actuel. Seule sa valeur associative actuelle détermine la valeur de l'apprentissage. Il n'importe pas que le SC soit déjà passé par plusieurs étapes de conditionnement et d'extinction auparavant.

Les deux premiers principes sont uniques au modèle Rescorla–Wagner. Les trois dernières étaient déjà précédentes dans des modèles plus anciens et jouent un rôle moins central, mais restent structurellement importantes[1].

Équation[modifier | modifier le code]

\Delta V^{n+1}_X = \alpha_X \beta (\lambda - V_{tot})

et

V^{n+1}_X = V^n_X + \Delta V^{n+1}_X

  • \Delta V_X est la variation dans la force de l'association of X
  • \alpha est la salience du SC (limites : 0 et 1)
  • \beta est le paramètre d'intensité pour le SI (limites : 0 et 1), parfois appelé valeur d'association
  • \lambda est le conditionnement maximal possible pour le SI
  • V_X est la force actuelle de l'association
  • V_{tot} est la force d'association totale du SC

Références[modifier | modifier le code]

  1. a et b Ralph R. Miller, Robert C. Barnet et Nicholas J. Grahame, « Assessment of the Rescorla-Wagner Model », Psychological Bulletin, American Psychological Association, vol. 117, no 3,‎ , p. 363–386 (PMID 7777644, DOI 10.1037/0033-2909.117.3.363)
  • Rescorla, R.A. & Wagner, A.R. (1972) A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement, Classical Conditioning II, A.H. Black & W.F. Prokasy, Eds., p. 64–99. Appleton-Century-Crofts.
  • Dawson, Michael, Minds and Machines: Connectionnism and Psychological Modeling, Blackwell Publishing, 2004, p. 36-40.

Voir aussi[modifier | modifier le code]

Lien externe[modifier | modifier le code]