L'Échantillonnage : Concepts, Taille et Types
Classé dans Électronique
Écrit le en
français avec une taille de 10,76 KB
Unité 5 : L'échantillonnage – Concepts fondamentaux
L'étude de l'échantillonnage commence par la distinction entre la population et l'échantillon.
- La population est l'ensemble dont on souhaite extraire l'information (individus, familles, logements, etc.).
- L'échantillon est le sous-ensemble d'unités de la population choisi pour extrapoler l'information.
La constitution de l'échantillon est réalisée par un processus appelé échantillonnage et dépend de la technique de recherche choisie. L'échantillon doit être représentatif, ce qui signifie que les attributs de la population doivent se retrouver dans la même proportion au sein de l'échantillon. C'est uniquement lorsque cette représentation est assurée que les conclusions tirées de l'échantillon peuvent être généralisées et appliquées à l'ensemble de la population.
Détermination de la taille de l'échantillon
La taille de l'échantillon dépend de divers facteurs (6) :
- Temps et ressources : Les contraintes de temps et de ressources disponibles influencent la taille finale de l'échantillon.
-
Mode d'échantillonnage :
- Échantillon probabiliste : généralement plus grand.
- Échantillon non probabiliste : généralement plus petit.
- Analyse de la diversité des données : L'application de techniques statistiques multivariées nécessite un nombre élevé de cas, ce qui contribue à réduire les erreurs d'échantillonnage.
- Variance ou hétérogénéité de la population : Plus la population est hétérogène, plus la variance est grande, et par conséquent, plus l'échantillon nécessaire est grand.
- Marge d'erreur : Ce facteur est impliqué dans la taille de l'échantillon lorsque la méthode d'échantillonnage est probabiliste. Une marge d'erreur plus petite exige un échantillon plus grand.
- Niveau de confiance : Tous les éléments de la population ont le même degré de probabilité d'être élus. Il existe trois niveaux de confiance courants : 68 %, 95,5 %, et 99,7 %. Le plus utilisé est 95,5 %.
Note : Des formules spécifiques sont utilisées pour calculer la taille de l'échantillon lorsque l'univers est supérieur à 100 000, ou lorsqu'il est de 100 000 ou moins.
Les deux grandes catégories d'échantillonnage
Il existe deux grandes catégories de types d'échantillonnage : les méthodes probabilistes et les méthodes non probabilistes.
Échantillonnage probabiliste
Dans l'échantillonnage probabiliste, tous les éléments de la population ont une probabilité connue d'être inclus dans l'échantillon. La sélection est aléatoire. Ses caractéristiques sont :
- Le critère de sélection est aléatoire.
- Tous les éléments sont également probables.
- L'erreur et la confiance peuvent être estimées.
- Les résultats peuvent être généralisés.
- C'est la seule méthode permettant d'évaluer la représentativité de l'échantillon.
- C'est la méthode la plus coûteuse.
- C'est la méthode la plus lente et la plus compliquée.
Échantillonnage non probabiliste
Dans l'échantillonnage non probabiliste, le critère utilisé n'est pas aléatoire. Ses caractéristiques sont :
- Les éléments de la population ne sont pas également susceptibles d'être inclus dans l'échantillon.
- Il est difficile d'estimer l'erreur et la confiance, car cela ne dépend pas uniquement de la taille de l'échantillon.
- Il y a un risque d'introduction de biais par le chercheur.
- Les coûts sont moins élevés.
En général, l'échantillonnage probabiliste présente plus d'avantages pour la généralisation des résultats.
Types d'échantillonnage probabiliste
Échantillonnage aléatoire simple
Tous les éléments de la population sont également susceptibles d'être inclus dans l'échantillon. Le non-respect de cette règle indique que l'échantillon présente des lacunes. Ses caractéristiques sont :
- Tous les éléments ont les mêmes chances d'être sélectionnés.
- La sélection est totalement aléatoire pour compléter l'échantillon.
Malgré sa simplicité, il n'est normalement pas utilisé dans la recherche sociale, sauf pour les collectifs petits et homogènes.
Échantillonnage aléatoire systématique
Contrairement à l'échantillonnage simple, seul le premier élément est tiré au hasard dans la fourchette obtenue en divisant la population (N) par la taille de l'échantillon (n) : Ratio = N/n. Les autres éléments sont choisis en ajoutant ce ratio au numéro précédent.
Exemple : N = 8000. n = 500. N/n = 16. On choisit au hasard un nombre parmi les 16 premiers éléments, par exemple 12. Le premier numéro est 12. Le second est 12 + 16 = 28. Le troisième est 28 + 16 = 44, et ainsi de suite jusqu'à atteindre la taille de l'échantillon.
Échantillonnage aléatoire stratifié
Cette méthode est utilisée lorsqu'il existe des sous-populations (strates) définies par un attribut ou une caractéristique associée à la variable étudiée. Elle implique de diviser la population en strates. C'est la technique la plus utilisée dans la recherche sociale.
Deux critères de base sont appliqués :
- Stratification : Les strates doivent être homogènes en composition interne, mais hétérogènes entre elles.
-
Répartition (Allocation) : Critère pour déterminer la taille de l'échantillon dans les différentes strates. Il existe 3 types d'allocation :
- Simple : Toutes les strates ont le même nombre d'éléments dans l'échantillon.
- Proportionnelle : Les strates ont un nombre d'éléments dans l'échantillon proportionnel à leur taille au sein de la population. C'est le critère le plus couramment utilisé.
- Optimale : Tient compte à la fois de la proportion de la strate et de sa variabilité par rapport à la variable étudiée.
Échantillonnage aléatoire en grappes
Utilisé dans les grandes populations géographiquement dispersées. La différence avec l'échantillonnage aléatoire simple est que l'on sélectionne des grappes (clusters) au lieu d'éléments individuels. Les grappes sont des groupes d'éléments qui sont hétérogènes en interne, mais homogènes entre les grappes.
Alors que dans l'échantillonnage stratifié, on sélectionne aléatoirement des individus (l'unité est l'individu), dans l'échantillonnage en grappes, on sélectionne aléatoirement des grappes (l'unité est la grappe).
Échantillonnage à plusieurs degrés
Si, à partir d'un échantillon en grappes, on procède à de nouvelles sélections d'échantillons au sein des grappes initiales, on parle d'échantillonnage à plusieurs phases ou à plusieurs degrés. Ce type d'échantillonnage permet d'accéder aux populations les plus grandes et les plus diverses. L'unité finale d'échantillonnage n'est pas la grappe originale, mais ses subdivisions.
Dans un échantillon simple à deux phases :
- Les groupes (unités primaires d'échantillonnage) sont choisis parmi les membres de la population étudiée.
- Les membres de la population à l'étude sont choisis au hasard au sein des unités primaires d'échantillonnage.
Un exemple de recherche d'unités d'ordre supérieur :
- Comptage des différentes zones géographiques.
- Choix aléatoire d'une zone géographique.
- Comptage des populations dans la zone géographique choisie.
- Choix aléatoire de la population.
- Tirage des différentes rues et interview des familles.
- Répétition jusqu'à atteindre la taille de l'échantillon.
En règle générale, l'échantillonnage multi-phase se fait en 3 ou 4 étapes. Il est couramment utilisé pour les échantillons nationaux.
Échantillonnage par itinéraires aléatoires
L'enquêteur utilise un itinéraire choisi aléatoirement sur une carte pour sélectionner les unités d'échantillonnage. La carte indique les points de départ (rues, bâtiments, etc.). L'itinéraire choisi par l'enquêteur doit satisfaire aux normes suivantes :
- Effectuer des tours sur place (à droite ou à gauche).
- Entrer dans certains bâtiments.
- Interroger les personnes ciblées.
Le principal inconvénient est la surreprésentation, car un même type de logement peut regrouper le même genre de personnes (retraités, chômeurs, femmes au foyer, etc.). Il est donc conseillé d'interroger des individus spécifiques et de limiter la fréquence des visites.
Types d'échantillonnage non probabiliste
Échantillonnage par quotas
Utilisé en particulier dans les études de marché et les sondages d'opinion. L'échantillonnage par quotas partage les premières étapes avec l'échantillonnage stratifié :
- Identification des groupes homogènes (âge, sexe, éducation, etc.).
- Détermination de la taille de l'échantillon dans chaque groupe (quotas).
La phase suivante est la différence majeure : les éléments de l'échantillon ne sont pas choisis au hasard, mais l'enquêteur suit une approche basée sur les quotas fixés. Par exemple, si l'on a besoin d'informations sur 2 catégories de sexe, 3 catégories d'âge et 4 catégories de revenu, cela représente un total de 2 x 3 x 4 = 24 groupes. Il peut être difficile d'identifier une taille d'échantillon précise pour chaque groupe.
Échantillonnage de commodité ou stratégique
Souvent utilisé dans la recherche exploratoire et lorsque les coûts doivent être réduits. Le critère utilisé est subjectif et dépend de l'intérêt ou de l'accessibilité pour le chercheur.
Échantillonnage « boule de neige »
Également appelé échantillonnage en chaîne, il est utilisé pour les petits groupes difficiles à trouver (immigrants illégaux, sectes, gangs, etc.). L'approche consiste à identifier un premier élément de l'échantillon, puis les éléments suivants sont sélectionnés sur la base des références fournies par les personnes interrogées. La taille de l'échantillon est déterminée par l'enquêteur. Le principal inconvénient est que les personnes interrogées sont généralement les plus visibles ou les plus connectées au sein du groupe ciblé.