Guide complet des concepts fondamentaux de la statistique

Classé dans Informatique

Écrit le en français avec une taille de 3,96 KB

Concepts de base en statistique

Population : Ensemble des personnes ou des choses faisant l'objet de l'étude. Les éléments sont les individus ou objets qui composent cette population.

Variables : Caractéristiques étudiées au sein de la population.

Types de variables

  • Quantitatives : Valeurs numériques.
    • Discrètes : Valeurs entières, sans décimales.
    • Continues : Valeurs numériques pouvant inclure des décimales.
  • Attributs (Qualitatives) : Valeurs exprimées en texte.
    • Ordonnées : Suivent un ordre logique.
    • Non ordonnées : Sans ordre spécifique.

Sources de données

  • Sources primaires : Informations de première main (entrevues, sondages).
  • Sources secondaires : Reflet des sources primaires (recensements, registres comme l'INE ou l'IBESTAT).

Tableaux statistiques et fréquences

Pour une étude, on recueille d'abord les données dans des tableaux :

  • Fréquence absolue : Nombre de fois où une valeur apparaît.
  • Fréquence relative : Résultat de la division de la fréquence absolue par la taille de l'échantillon.
  • Fréquence absolue cumulée : Somme des fréquences des valeurs inférieures ou égales à une valeur donnée.

Lorsque le nombre de valeurs est élevé, on regroupe les données en intervalles.

Représentations graphiques

Pour réussir un graphique, les axes doivent commencer à 0 et les intervalles doivent être égaux.

  • Graphique en colonnes : Utilisé pour des variables non continues.
  • Graphique à barres : Similaire aux colonnes, mais avec des axes inversés (horizontal).
  • Graphique linéaire : Points reliés par une ligne pour montrer une évolution.
  • Graphique de proportions : Utilise des pourcentages.
  • Graphique de dispersion : Montre la dispersion entre des variables quantitatives continues.

Mesures de tendance centrale et de dispersion

Centralisation

  • Moyenne arithmétique : Somme des valeurs divisée par la taille de l'échantillon.
  • Médiane : Valeur centrale d'une série ordonnée.
  • Mode : Valeur la plus fréquente.
  • Quartiles : Points divisant la fréquence en quatre parties égales.

Dispersion

  • Écart moyen : Différence entre les valeurs et la moyenne.
  • Variance : Moyenne des carrés des écarts.
  • Écart-type : Racine carrée de la variance.
  • Coefficient de variation : Écart-type divisé par la moyenne (exprimé en %).
  • Courbe de Lorenz : Mesure la concentration d'une distribution.

Associations bivariées

  • Variable indépendante : Non modifiée par une autre.
  • Variable dépendante : Affectée par la variable indépendante.
  • Coefficient de corrélation : Détermine la force et le sens d'une relation.
    • C. de Spearman : Pour les valeurs ordinales.
    • C. de Pearson : Pour les valeurs réelles.

Analyse factorielle multivariée

Technique visant à réduire la taille des données tout en conservant un maximum d'informations.

  • Analyse confirmatoire : Utilise des matrices de corrélation, l'extraction et la rotation de facteurs pour interpréter les données.
  • Analyse exploratoire : Utilise la sélection de variables, des mesures de distance et des algorithmes de clustering (méthodes hiérarchiques).

Entrées associées :