Statistiques : Définitions, Concepts Clés et Applications
Classé dans Électronique
Écrit le en français avec une taille de 13,19 KB
Définitions des Statistiques
La statistique est généralement considérée comme une collection de faits numériques exprimés en termes d'une relation ordonnée et recueillis à partir d'autres données numériques.
Kendall et Buckland (cités par Gini V. Glas / C. Stanley Julian, 1980) définissent la statistique comme une valeur résumée, calculée à partir d'observations d'un échantillon, qui est généralement, mais pas nécessairement, considérée comme une estimation d'un paramètre d'une population donnée ; c'est-à-dire une fonction des valeurs de l'échantillon.
"La statistique est une technique spéciale adaptée à l'étude quantitative des phénomènes de masse ou collectifs, dont l'étude requiert l'observation massive de phénomènes plus simples appelés individus." (Gini, 1953)
Murray R. Spiegel (1991) dit : "La statistique étudie les méthodes scientifiques pour recueillir, organiser, résumer et analyser les données, ainsi que pour tirer des conclusions valides et prendre des décisions raisonnables sur la base de cette analyse."
"La statistique est la science qui traite de la collecte, du classement et de la présentation des faits soumis à une appréciation numérique pour leur explication, description et comparaison des phénomènes." (Yale et Kendall, 1954)
Importance Scientifique
Quel que soit le point de vue adopté, l'élément clé est l'importance scientifique des statistiques, en raison du large éventail d'applications possibles.
Concepts Clés en Statistiques
Population
Le concept de population en statistique va au-delà de ce qui est communément entendu. Une population se définit comme un ensemble fini ou infini de personnes ou d'objets partageant des caractéristiques communes.
"Une population est un ensemble de tous les éléments considérés pour une étude, à partir duquel nous essayons de tirer des conclusions." Levin et Rubin (1996)
"Une population est un ensemble d'éléments possédant une caractéristique commune." Chains (1974)
Exemple : Les membres de l'Ordre des Ingénieurs de l'État de Cojedes.
La taille d'une population, déterminée par le nombre d'éléments qui la composent, est un facteur clé dans le processus de recherche statistique. Selon ce nombre, une population peut être finie ou infinie. Lorsque le nombre d'éléments composant la population est très grand, elle peut être considérée comme infinie (par exemple, l'ensemble des nombres positifs). Une population finie est constituée d'un nombre limité d'éléments (par exemple, le nombre d'étudiants du noyau San Carlos de l'Universidad Nacional Experimental Simón Rodríguez).
Échantillon
"Un échantillon représente une partie de la population étudiée, utilisée pour la représenter." Murray R. Spiegel (1991)
"Un échantillon est une collection de certains éléments issus de la population, mais pas de tous." Levin et Rubin (1996)
"Un échantillon doit être défini sur la base de la population de référence, et les conclusions obtenues à partir de cet échantillon ne peuvent se référer qu'à cette population." Chains (1974)
Exemple : L'étude de 50 membres du Collège des Ingénieurs de l'État de Cojedes.
L'étude d'échantillons est plus simple, moins coûteuse et plus rapide que l'étude de la population entière. De plus, même un examen exhaustif d'une population peut laisser passer des éléments défectueux ; ainsi, dans certains cas, l'échantillonnage peut paradoxalement améliorer le contrôle qualité.
Un échantillon représentatif contient les caractéristiques principales de la population dans les mêmes proportions que celles-ci existent dans ladite population.
Les statisticiens collectent des données à partir d'un échantillon. Ils utilisent ces informations pour faire des inférences sur la population représentée par cet échantillon. Par conséquent, échantillon et population sont des notions relatives : une population est un tout, et un échantillon en est une fraction ou un segment.
Variables et Attributs
Les variables, souvent appelées caractères quantitatifs, sont celles qui peuvent être exprimées numériquement. Ce sont des caractéristiques capables de mesure, comme la taille, le poids, le revenu, l'âge, etc.
Selon Murray R. Spiegel (1992), "une variable est un symbole (par exemple X, Y, Hx) qui peut prendre n'importe quelle valeur d'un ensemble spécifique, appelé le domaine de la variable. Si la variable ne peut prendre qu'une seule valeur, elle est appelée une constante."
Tous les éléments d'une population possèdent les mêmes types de caractéristiques, mais comme celles-ci ne se manifestent généralement pas avec la même intensité, les variables prennent différentes valeurs. Ces différentes modalités ou mesures constituent les valeurs de la variable.
Collecte des Données
Méthodes de Collecte
En statistique, diverses méthodes sont utilisées pour obtenir les informations nécessaires à une étude. Nous aborderons ici les méthodes les plus importantes, en soulignant leurs avantages et inconvénients.
Entretien Personnel
L'entretien personnel : Les données statistiques nécessaires à une recherche sont fréquemment collectées par un enquêteur qui rencontre directement la personne étudiée. L'enquêteur pose à cette personne une série de questions pré-écrites sur un questionnaire et enregistre les réponses. Cette procédure, appelée entretien personnel, permet d'obtenir des informations plus précises et complètes que d'autres méthodes. Grâce au contact direct, l'enquêteur peut clarifier les questions ou répondre aux interrogations de la personne interrogée concernant le questionnaire ou la recherche.
Avantages :
- Permet d'obtenir des informations plus précises et complètes.
- Possibilité pour l'enquêteur de clarifier les questions.
- Possibilité pour l'enquêteur d'adapter le langage des questions au niveau de compréhension de la personne interrogée.
Inconvénients :
- Si l'enquêteur manque de bonne foi ou de formation adéquate, il peut influencer ou altérer les réponses des personnes interrogées.
- Coût et temps potentiellement élevés.
Quelle est l'importance des statistiques au quotidien ?
Elles sont si importantes qu'il n'existe quasiment aucune activité humaine où les statistiques n'interviennent pas. La plupart des décisions importantes de notre vie sont prises en s'appuyant sur l'application des statistiques. Prenons quelques exemples :
- Le recensement de la population
- Les études sur le panier de la ménagère
- La détermination de l'inflation
- Les augmentations de salaire
- La fréquence des accidents
- La fréquence des maladies
- Les tarifs d'assurance-vie
- Les tarifs des bus
- Les tarifs des hôtels et taxis
- Les causes de mortalité infantile
- Les préférences pour les candidats politiques
- Les audiences TV et radio (pour la publicité)
- Les besoins en écoles
- La vente de produits
Statistiques : Outil d'Aide à la Décision
Prendre des décisions éclairées est crucial pour l'orientation d'une entreprise et peut mener à de meilleures opportunités, y compris salariales.
Lorsqu'une entreprise recrute pour un poste de direction, elle privilégie les candidats capables de prendre de bonnes décisions. Elle ne choisit pas ceux qui attendent passivement les instructions, mais plutôt ceux qui prennent des initiatives et décident de la marche à suivre en cas d'urgence, même en l'absence de leur supérieur.
Le meilleur employé n'est pas nécessairement celui qui travaille le plus dur physiquement, mais celui qui réfléchit et prend des décisions jugées raisonnablement correctes.
Pour prendre des décisions efficaces, il faut être capable de combler les manques d'information de la manière la plus rationnelle possible.
C'est là que les statistiques interviennent : elles aident à prendre de bonnes décisions rationnelles en comblant ces lacunes informationnelles.
Ce contenu vise à enseigner progressivement l'utilisation des statistiques pour acquérir une compréhension plus approfondie et rationnelle du comportement d'un processus. Grâce aux statistiques, nous pouvons voir au-delà des apparences.
Traitement des Données Statistiques
Données Non Groupées
Il s'agit d'une collection d'informations brutes. Lorsque l'échantillon est petit (généralement moins de 20-30 éléments), les données sont souvent analysées sans les regrouper en classes. On parle alors de traitement de données non groupées.
Mesures de Tendance Centrale (Données Non Groupées)
Les mesures de tendance centrale (moyenne arithmétique, médiane, mode, moyenne géométrique, etc.) sont ainsi nommées car, lors de l'observation de la distribution des données, elles tendent à se situer au centre de celle-ci. Elles indiquent une valeur typique ou centrale de l'ensemble de données.
Dispersion (Données Non Groupées)
La dispersion fait référence à l'étalement de la distribution des données, c'est-à-dire la mesure dans laquelle les observations sont réparties autour du centre.
Données Groupées
Lorsque le volume de données est important, il est souvent utile de les regrouper en classes ou intervalles pour en faciliter l'analyse. On parle alors de données groupées.
Mesures de Dispersion (Données Groupées)
Les mesures de dispersion permettent de quantifier l'écart des valeurs de la variable par rapport à une valeur centrale ou d'identifier la concentration des données dans une certaine partie de l'étendue de la variable. Ces coefficients s'appliquent aux variables quantitatives.
Mesures de Tendance Centrale (Données Groupées)
La statistique vise, entre autres, à décrire les caractéristiques typiques d'un ensemble de données. Comme il existe plusieurs façons de le faire, divers types de moyennes sont utilisés. Elles sont appelées mesures de tendance centrale car la plupart des données ont tendance à s'accumuler autour des valeurs intermédiaires.
Les mesures de tendance centrale couramment utilisées pour les données groupées incluent :
- Moyenne arithmétique
- Médiane
- Mode
- Moyenne géométrique
- Moyenne harmonique
- Les quantiles (quartiles, déciles, percentiles)