Le Conditionnement Instrumental et Opérant en Psychologie

Classé dans Sport et éducation physique

Écrit le en français avec une taille de 8,24 KB

Le Conditionnement Instrumental

Le comportement est un instrument pour parvenir à la solution ou à la récompense, soit ce que le sujet désire.

Dans le conditionnement classique, l'apprentissage se produit au niveau du stimulus (S-learning), tandis que dans le conditionnement instrumental, l'apprentissage se fait au niveau de la réponse (R). Dans le premier cas, le renforcement se produit indépendamment de l'objet ; dans le second, le renforcement opérant et instrumental est une conséquence directe du propre comportement du sujet.

L'apprentissage est, selon Thorndike, un processus d'essais et d'erreurs, car l'animal est récompensé pour les conséquences de ses réponses (R) couronnées de succès (par exemple, s'échapper d'une cage).

Les Lois de l'Apprentissage : Contributions de Thorndike

Loi de l'effet

« Lorsqu'un lien modifiable entre une situation et une réponse (R) est établi et qu'il est suivi d'un état de satisfaction, la force de la connexion augmente. Lorsqu'il est suivi d'un état de malaise, sa force diminue. » (Récompenses et punitions).

La punition supprime la réponse (R), mais ne la fait pas disparaître, car elle informe uniquement sur ce qu'il ne faut pas faire. Cependant, les récompenses produisent un véritable apprentissage.

Loi de l'exercice

(Importance de la pratique). Les connexions Stimulus-Réponse (S-R) sont renforcées par l'usage et diminuent avec la désuétude.

Loi de l'état de préparation

(Motivation et développement). Lorsque le sujet est prêt à agir, l'action est renforçante ; ne pas pouvoir agir crée de l'aversion.

Implications pour l'Éducation selon Thorndike

Selon Thorndike (1912), les enseignants doivent appliquer la loi de l'effet pour que les étudiants acquièrent des habitudes positives, selon les principes suivants :

  • 1) Entraîner les habitudes. Ne pas attendre qu'elles se forment seules.
  • 2) Veiller à ne pas former une habitude qui devra être supprimée plus tard.
  • 3) Ne pas former deux ou plusieurs habitudes si une seule suffit.
  • 4) À efficacité égale, former les habitudes de la façon dont elles seront pratiquées (applications de l'apprentissage en lien avec le contenu des programmes).

Le Conditionnement Opérant

Skinner définit le conditionnement comme le renforcement d'un comportement à la suite d'un renforcement. Il distingue deux types de comportements (réponses) : le type S (pavlovien), dans lequel le stimulus (S) crée un réactif, et le type R, dans lequel la réponse (R) est émise car elle agit sur le milieu pour produire un effet.

Processus de Base du Conditionnement Opérant

Skinner (1950) considère que la réponse (R) ou la conduite se situe entre deux influences environnementales : celles qui la précèdent (antécédents) et celles qui la suivent (conséquences). C'est le modèle Antécédent-Comportement-Conséquence (ABC).

Un stimulus discriminatif positif indique que si le comportement est émis en sa présence, il sera suivi d'un renforcement. S'il est négatif, il indique qu'il n'y aura pas de renforcement.

Le Renforcement

Processus chargé de renforcer la réponse (R) ou le comportement, augmentant la probabilité que ce comportement se répète.

Les Renforçateurs

Stimuli spécifiques qui favorisent le renforcement. La valeur d'un renforçateur dépend de l'histoire biographique du sujet, de son apprentissage, ainsi que de sa situation physiologique et psychologique actuelle. On distingue les renforçateurs primaires, secondaires, conditionnés et généralisés.

Types de Renforcement et de Punition

  • Renforcements : Augmentent la probabilité que le comportement se répète.
    • Renforcement positif : Le comportement est suivi d'un résultat positif.
    • Renforcement négatif : Le comportement est suivi du retrait d'une conséquence négative.
  • Punition (Répression) : Diminue la probabilité que le comportement se répète.
    • Punition positive : Présentation d'un résultat négatif après une réponse.
    • Punition négative : Retrait d'un résultat positif après une réponse.

Programmes de Renforcement

Il s'agit de la règle déterminant quand l'émergence d'une réponse (R) est suivie d'un renforcement.

  • Programmes de renforcement continu : On reçoit un renforcement après chaque bonne réponse.
  • Programmes de renforcement intermittent : Définis en fonction des réponses (ratio) ou du temps (intervalle) :
    • 1) Programme à rapport fixe (RF)
    • 2) Programme à rapport variable (RV)
    • 3) Programme à intervalle fixe (IF)
    • 4) Programme à intervalle variable (IV)

Principe de Premack

Un comportement fréquent et privilégié chez le sujet (activité favorite) peut servir de renforcement pour une conduite moins fréquente que l'on souhaite promouvoir.

La Répression (Punition)

Elle supprime la réponse (R) mais ne l'élimine pas. Si la menace disparaît, le comportement peut revenir. La sanction ne doit s'appliquer que lorsqu'aucune alternative n'existe. Implications éducatives :

  • 1) Mise en œuvre rapide pour ne pas perdre d'efficacité.
  • 2) Accompagnement d'un renforcement positif pour un comportement alternatif approprié.
  • 3) Durée proportionnée, ni trop longue ni trop intense.
  • 4) Développement d'une alternative acceptable et efficace.
  • 5) Explication de la contingence de la peine (information préalable).

Généralisation, Discrimination et Extinction

  • Généralisation : Extension de l'effet du renforcement à d'autres stimuli similaires. Ce n'est pas automatique et cela varie selon le sujet.
  • Discrimination : Inverse de la généralisation. Consiste à répondre à certains stimuli mais pas à d'autres, selon les caractéristiques de la situation.
  • Extinction : Un comportement appris peut disparaître si l'on cesse de le renforcer après l'émission de la réponse (R). On note parfois un phénomène de « récupération spontanée ».

Implications pour l'Éducation

A) Promotion des comportements

  • 1) Signalisation et incitation : La signalisation établit les conditions de performance. L'incitation est une aide supplémentaire pour répondre précisément au signal.
  • 2) Renforcement positif : Méthode principale pour promouvoir des comportements sains.
  • 3) Façonnage (Moulage) : Renforcement des progrès vers un but par approximations successives.
  • 4) Contrôle des stimuli : Certains stimuli facilitent davantage certains comportements.
  • 5) Économie de jetons : Utilisation de renforçateurs conditionnés pour renforcer progressivement les comportements appropriés.

B) Élimination ou réduction des comportements

  • 1) Renforcement différentiel d'autres comportements (RDO) : Renforcer un comportement incompatible avec le comportement inapproprié.
  • 2) Coût de la réponse : Punition par la perte de renforcements acquis.
  • 3) Surcorrection : Pénalité consistant à réparer les conséquences de l'inconduite ou à pratiquer une réponse positive.
  • 4) Économie de jetons : Également utilisée pour réduire les comportements inappropriés en cessant de les renforcer.
  • 5) Satiété : Répéter un comportement jusqu'à la fatigue pour qu'il cesse.
  • 6) Temps mort (Time-out) : Écarter le sujet de la source de stimuli renforçateurs pendant une période proportionnelle à son âge.

Entrées associées :