Conditionnement opérant

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le conditionnement opérant (aussi appelé conditionnement instrumental, apprentissage skinnerien ou conditionnement de type II) est un concept du béhaviorisme initié par Edward Thorndike et développé par Skinner au milieu du XXe siècle. Cette théorie s'intéresse à l'apprentissage duquel résulte une action, tenant compte des conséquences de cette dernière rendant plus ou moins probable la reproduction du dit comportement. Skinner distingue le conditionnement opérant du conditionnement classique par ses conséquences sur l'environnement et par le fait que la réponse ne soit pas une réaction réflexe de l'organisme.

Concept[modifier | modifier le code]

L'apprentissage skinnerien repose sur deux éléments, le renforcement et la punition, pouvant chacun être soit positif soit négatif. Ces termes doivent être pris dans le sens précis du conditionnement opérant :

  • Renforcement : Conséquence d'un comportement qui rend plus probable que le comportement soit reproduit de nouveau.
  • Punition : Conséquence d'un comportement qui rend moins probable que le comportement soit reproduit de nouveau.

Un renforcement ou une punition peut être soit :

  • Positif : Par l'ajout d'un stimulus agissant sur l'organisme.
  • Négatif : Par le retrait d'un stimulus agissant sur l'organisme.

Ainsi, il existe 4 types de conditionnement opérant :

  • Renforcement positif : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter suite à l'ajout d'un stimulus appétitif contingent à la réponse Ex: Ajout d'une récompense, félicitations...
  • Renforcement négatif : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter suite au retrait d'un stimulus aversif contingent à la réponse. Ex: Retrait d'une obligation, d'une douleur...
  • Punition positive : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite à l'ajout d'un stimulus aversif ou conséquence aversive contingente au comportement cible. Ex: Ajout d'une obligation, d'une douleur...
  • Punition négative : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite au retrait d'un stimulus appétitif. Ex: Retrait d'un privilège, d'un droit...

Il existe 2 sortes de renforçateurs (éléments de renforcement) :

  • Renforçateur primaire : Le renforçateur répond directement à un besoin essentiel de l'individu. Ex: Nourriture...
  • Renforçateur secondaire : Le renforçateur est un renforçateur par un certain apprentissage fait au préalable. Ex: Jouet, argent...

Edward Thorndike[modifier | modifier le code]

En 1898, Edward Thorndike, qui préparait un doctorat, fut le premier a décrire les principes du conditionnement opérant (ne portant pas encore ce nom) en observant des chats tentant de sortir de leur cage afin d'aller chercher un morceau de poisson. Le chat essayait de sortir par tâtonnement. Après avoir tiré sur une ficelle, la porte de sa cage s'ouvrit. Lorsqu'on le remit à l'intérieur, celui-ci mettait beaucoup moins de temps à réussir. Selon Thorndike, le comportement résulte de l'effet qu'il procure (loi de l'effet).

Expériences de Skinner[modifier | modifier le code]

Boîte de Skinner

La plupart des expériences effectuées à propos du conditionnement opérant sont faites sur des animaux. La boîte de Skinner est souvent utilisée comme outil.

Dans ses premières expériences, Skinner utilisait cette invention de son cru pour démontrer les mécanismes du conditionnement opérant. Il a d'abord pris un rat auquel il a appris à se nourrir de la nourriture qu'il laissait traîner dans la cage. Lorsqu'il le mit dans la boîte de Skinner, le rat se mit à agir comme les autres rats qui cherchent leur nourriture en courant et en reniflant. Ainsi, lorsque l'animal accrocha par inadvertance un levier, une boulette de nourriture tomba dans la cage. Ensuite, le rat continua de se comporter comme n'importe quel rat et finit par réaccrocher le levier. Une nouvelle boulette tomba. Peu à peu, le rongeur commença à appuyer plus souvent sur le levier et, finalement, à le faire chaque fois qu'il avait faim. Ce système est un système de renforcement positif (la nourriture).

Superstitions[modifier | modifier le code]

Selon les béhavioristes, les superstitions résultent d'un renforcement ou d'une punition qui peut découler d'une simple coïncidence. Skinner fut le premier à le démontrer. D'abord, il plaça huit pigeons dans des cages séparées qui leur donnait de la nourriture toutes les quinze secondes exactement. Cependant, les pigeons, qui adoptaient différents comportements naturels indépendamment de la nourriture ont fini par croire en un lien entre une certaine action ou position et l'arrivée de la nourriture, ce qui n'était pas le cas. Ils adoptaient donc le comportement superstitieux qui, croyaient-ils, leur permettait d'être nourris.

Phénomènes liés au conditionnement opérant[modifier | modifier le code]

  • Façonnement : Phénomène par lequel on renforce un certain comportement se rapprochant plus ou moins du comportement souhaité jusqu'à ce qu'il aboutisse. Cela peut s'étendre à un ensemble de plusieurs comportements consécutifs et complexes.

- Le façonnement peut être continu : C'est-à-dire qu'il est renforcé à chaque comportement satisfaisant. Dans ce cas, le comportement souhaité s'acquiert plus vite mais disparait plus vite aussi. - Le façonnement peut être intermittent : C'est-à-dire qu'il est parfois renforcé lorsque le comportement est satisfaisant. Dans ce cas, le comportement souhaité s'acquiert moins vite mais disparaît moins vite aussi.

  • Généralisation : Le comportement est adopté ou évité dans d'autres circonstances ayant une certaine ressemblance avec le comportement renforcé ou puni.
  • Discrimination : Le comportement est adopté ou évité dans des circonstances bien précises et ne l'est pas dans d'autres ayant une certaine ressemblance avec le comportement renforcé ou puni.
  • Extinction : Après un certain temps où le comportement n'est plus renforcé ou puni, le comportement disparaît peu à peu.
  • Récupération spontanée : Après un certain temps où le comportement a disparu, il réapparaît soudainement.

Voir aussi[modifier | modifier le code]