Guide complet des concepts fondamentaux de la statistique
Classé dans Informatique
Écrit le en
français avec une taille de 3,96 KB
Concepts de base en statistique
Population : Ensemble des personnes ou des choses faisant l'objet de l'étude. Les éléments sont les individus ou objets qui composent cette population.
Variables : Caractéristiques étudiées au sein de la population.
Types de variables
- Quantitatives : Valeurs numériques.
- Discrètes : Valeurs entières, sans décimales.
- Continues : Valeurs numériques pouvant inclure des décimales.
- Attributs (Qualitatives) : Valeurs exprimées en texte.
- Ordonnées : Suivent un ordre logique.
- Non ordonnées : Sans ordre spécifique.
Sources de données
- Sources primaires : Informations de première main (entrevues, sondages).
- Sources secondaires : Reflet des sources primaires (recensements, registres comme l'INE ou l'IBESTAT).
Tableaux statistiques et fréquences
Pour une étude, on recueille d'abord les données dans des tableaux :
- Fréquence absolue : Nombre de fois où une valeur apparaît.
- Fréquence relative : Résultat de la division de la fréquence absolue par la taille de l'échantillon.
- Fréquence absolue cumulée : Somme des fréquences des valeurs inférieures ou égales à une valeur donnée.
Lorsque le nombre de valeurs est élevé, on regroupe les données en intervalles.
Représentations graphiques
Pour réussir un graphique, les axes doivent commencer à 0 et les intervalles doivent être égaux.
- Graphique en colonnes : Utilisé pour des variables non continues.
- Graphique à barres : Similaire aux colonnes, mais avec des axes inversés (horizontal).
- Graphique linéaire : Points reliés par une ligne pour montrer une évolution.
- Graphique de proportions : Utilise des pourcentages.
- Graphique de dispersion : Montre la dispersion entre des variables quantitatives continues.
Mesures de tendance centrale et de dispersion
Centralisation
- Moyenne arithmétique : Somme des valeurs divisée par la taille de l'échantillon.
- Médiane : Valeur centrale d'une série ordonnée.
- Mode : Valeur la plus fréquente.
- Quartiles : Points divisant la fréquence en quatre parties égales.
Dispersion
- Écart moyen : Différence entre les valeurs et la moyenne.
- Variance : Moyenne des carrés des écarts.
- Écart-type : Racine carrée de la variance.
- Coefficient de variation : Écart-type divisé par la moyenne (exprimé en %).
- Courbe de Lorenz : Mesure la concentration d'une distribution.
Associations bivariées
- Variable indépendante : Non modifiée par une autre.
- Variable dépendante : Affectée par la variable indépendante.
- Coefficient de corrélation : Détermine la force et le sens d'une relation.
- C. de Spearman : Pour les valeurs ordinales.
- C. de Pearson : Pour les valeurs réelles.
Analyse factorielle multivariée
Technique visant à réduire la taille des données tout en conservant un maximum d'informations.
- Analyse confirmatoire : Utilise des matrices de corrélation, l'extraction et la rotation de facteurs pour interpréter les données.
- Analyse exploratoire : Utilise la sélection de variables, des mesures de distance et des algorithmes de clustering (méthodes hiérarchiques).