Thorndike et Skinner : Les Fondements du Béhaviorisme

Classé dans Sport et éducation physique

Écrit le en français avec une taille de 7,47 KB

Edward Thorndike : L'apprentissage instrumental

Edward Thorndike, contemporain de Pavlov (conditionnement classique), a théorisé l'apprentissage instrumental. Dans ce modèle, un animal est renforcé par une conséquence pour apprendre un comportement. Ses expériences ont montré qu'un chat affamé, placé dans une boîte à problèmes, peut apprendre à découvrir le mécanisme lui permettant de s'échapper et d'accéder à un plat de nourriture. L'animal apprend selon les éventualités ; son comportement est modifié par celles-ci. L'apprentissage se manifeste par la réduction du temps nécessaire pour s'échapper ou par la diminution du nombre d'erreurs lors d'épreuves successives.

Théorie de l'association et connexionnisme

La théorie de l'association (ou connexionnisme) constate que l'apprentissage est la connexion entre l'impression sensorielle (du stimulus au cerveau) et la dynamique de l'action. Ce résultat est obtenu par essais et erreurs (connexions continues), où le cerveau finit par enregistrer la réponse correcte et effacer l'erreur. Le test de cet apprentissage est le temps passé ou le nombre d'erreurs avant d'atteindre l'objectif. Les éléments de l'environnement facilitant l'association sont appelés contingences de renforcement.

Les trois lois de l'apprentissage de Thorndike

Cette théorie a conduit au domaine de l'éducation avec des lois expliquant l'apprentissage humain et animal :

  • 1. Loi de l'état de préparation (ou disposition) : C'est la tendance à l'action qui génère une attitude en vue de l'action elle-même. Elle prépare le corps : Activation -> Génération de l'action. Par exemple, un animal courant après sa proie est prêt à bondir.
  • 2. Loi de l'exercice (ou de la pratique) : Les liens sont renforcés par la pratique (loi de l'utilisation). L'apprentissage n'est possible que par l'action renforcée. Sans performance continue, l'apprentissage s'oublie. La base est l'essai-erreur, avec plus de chances de succès si la réponse est renouvelée immédiatement.
  • 3. Loi de l'effet : Lorsqu'une connexion réversible entre une situation et une réponse est suivie d'un état satisfaisant (rappel), le lien se renforce, incitant à répéter le comportement. À l'inverse, une situation insatisfaisante affaiblit la connexion.

Différenciation de la récompense et du châtiment

Thorndike réalise que la loi de l'effet nécessite un renforcement. La récompense est toujours plus forte que la punition. L'effet de la peine est indirect : il exige que l'animal soit confronté à ce qui le dérange pour empêcher le comportement. Ce sont les bases du conditionnement opérant repris par Skinner. Thorndike est un néobéhavioriste qui considère la motivation comme essentielle en psychologie de l'éducation. Pour aider l'enfant, il faut examiner son intérêt pour le travail, son désir d'amélioration et le sens qu'il donne à ses actions (attitude et attention). À ces trois lois s'ajoutent cinq lois subordonnées : les réponses multiples, l'attitude, la prédominance d'éléments, la réponse par analogie et le déplacement associatif.

B.F. Skinner : Le béhaviorisme radical

B.F. Skinner a étudié le système nerveux (SN) chez les animaux. Il a étendu les idées de Thorndike, plaçant la loi de l'effet au cœur des théories comportementales dominant la psychologie jusqu'aux années 60. Son approche est définie comme un « béhaviorisme radical, athéorique et descriptif ». Il identifie les urgences fonctionnelles sans chercher à les expliquer dogmatiquement. Il croit en la relation Stimulus-Réponse (E-R), affirmant que les théories doivent être constamment corroborées.

Comportement et méthode scientifique

Skinner reprend les principes de Watson sur les influences extérieures. Le comportement est ce que le corps fait et que l'on peut observer ; sans observation, il n'y a pas de comportement. L'accent est mis sur le mesurable. Le but de la science est de comprendre, prévoir, contrôler et modifier les comportements. Selon le béhaviorisme descriptif, les lois de la conduite s'appliquent à chaque individu, car chacun a une histoire différente.

Critique de la psychanalyse et de l'éducation

Skinner estime que la psychanalyse n'est pas productive car elle se réfère à des structures de personnalité non mesurables. Concernant l'éducation, il critique les conduites dominées par une stimulation aversive (critique, dérision). Il note un délai trop long entre le comportement et le renforcement. Il propose une intervention sur deux axes : la construction de répertoires verbaux/non-verbaux et l'augmentation des actions générant l'intérêt d'apprendre.

Méthodologie d'étude et rôle du psychologue

L'étudiant doit recevoir un renforcement immédiat et fréquent, avancer à son rythme et suivre une séquence cohérente. Bien qu'il puisse paraître passif, il doit apprendre activement pour être renforcé. Le rôle du psychologue thérapeute est de comprendre les conditions de renforcement pour préparer une lutte culturelle via l'ingénierie sociale. L'objectif est de renforcer les comportements adaptatifs et d'éliminer les autres.

L'être humain comme « boîte noire »

L'homme est considéré comme un sujet « boîte fermée ». Skinner ne nie pas les processus internes mais refuse de les étudier, se concentrant sur les entrées (inputs) et sorties (outputs). L'humain est une tabula rasa, une personne vide modifiée par son environnement (position neutre et passive). La motivation est centrée sur les renforts ; les forces internes, non mesurables, sont ignorées dans l'analyse causale.

Phénomènes internes et statistiques

Les faits internes sont considérés comme corrélés à la réponse, mais la causalité vient toujours de l'environnement externe. Skinner ne nie pas l'auto-observation introspective, mais souligne que tout n'est pas étudiable par ce biais. Il se méfie des statistiques et des comparaisons de groupes, privilégiant les expériences sur de longues périodes avec un sujet unique. Sa psychologie est mécaniste et réductrice.

Programmes et types de renforcement

La stimulation renforçatrice augmente la probabilité d'une réponse. On distingue deux types de comportements :

  • 1. Répondants : Comportements automatiques ou réflexes par association.
  • 2. Instrumentaux : Conduites émises spontanément dont la répétition dépend des conséquences environnementales.

Les programmes de renforcement incluent :

  • Intervalle fixe : Renforcement après un temps donné (ex: salaire).
  • Intervalle variable : Plus efficace que le fixe.
  • Rapport (ratio) fixe : Renforcement après un nombre précis de réponses.
  • Rapport (ratio) variable : Renforcement aléatoire, quel que soit le nombre de réponses.

Le programme à rapport variable est celui qui a la plus grande probabilité de maintenir durablement une conduite.

Entrées associées :