Formules et Concepts Clés en Statistiques Descriptives

Classé dans Physique

Écrit le en français avec une taille de 94,71 KB

Mesures de Tendance Centrale

Moyenne Arithmétique

La moyenne arithmétique est calculée selon le type de données :

Formule

Formule

Formule

Formule

Cas d'application de la Moyenne Arithmétique

  • Données regroupées par intervalles (xi = centre de classe).
  • Données non regroupées (tableau de fréquences simples).
  • Données groupées (tableaux).

Médiane (Me)

La médiane est la valeur centrale d'une série de données ordonnées. Les observations doivent être ordonnées par ordre croissant.

  • Si n est pair : Formule
  • Si n est impair : Formule

La médiane est la valeur qui occupe la position centrale dans la série ordonnée.

Mode (Mo)

Le mode est la valeur qui est répétée le plus souvent dans la série de données (la valeur ayant la fréquence la plus élevée).

Milieu de Gamme (RM)

Le milieu de gamme (ou étendue médiane) est calculé comme suit :

Formule

Autres Mesures de Tendance Centrale et Quantiles

  • Moyenne Géométrique (G) : Formule Formule
  • Moyenne Harmonique (H) : Formule Formule
  • Moyenne Quadratique (Q) : Formule

Quantiles

Centile : Formule

K-ième Centile : Formule

Mesures de Dispersion

Formule

Étendue (Re)

L'étendue (Range) est la différence entre la valeur maximale et la valeur minimale :

Formule

Variance (S²)

La variance mesure la dispersion des données autour de la moyenne.

  • Formule théorique : Formule
  • Formule de calcul : Formule

Propriétés de la Variance

  • V(x) Formule 0 (La variance est toujours positive ou nulle).
  • Changement d'origine : La variance ne change pas.
  • Changement d'échelle : V(kX) = k² * V(X).
  • V(k) = 0 (La variance d'une constante est nulle).

Écart-Type

L'écart-type est la racine carrée positive de la variance :

Formule

Écart Interquartile

L'écart interquartile (EI) est la différence entre le troisième quartile (Q3) et le premier quartile (Q1) :

EI = Q3 - Q1 Formule

Taux d'Ouverture

Formule

Coefficient de Variation (CV)

Le Coefficient de Variation est une mesure de dispersion relative, souvent exprimée en pourcentage :

CV (%) = (Écart-type / Moyenne arithmétique) Formule

Interprétation :

  • Plus le CV est élevé, plus les données sont dispersées.
  • Le CV n'est pas toujours positif si la moyenne est négative (bien que l'écart-type soit toujours positif).

Moments Statistiques

Moments d'Ordre r par Rapport à l'Origine

Formule générale :

Formule

Moments Centrés (par Rapport à la Moyenne)

Formule générale :

Formule

Exemples de Moments Centrés

  • Moment centré de second ordre (Variance) : Formule

Formule

Mesures de Forme : Asymétrie (Skewness) et Kurtosis

Mesures d'Asymétrie

Coefficient d'Asymétrie de Pearson (Ap)

Formule

Formule

Plus la valeur absolue de Ap est grande, plus l'asymétrie est prononcée.

  • Ap > 0 : Distribution décalée vers la droite (Asymétrie Positive).
  • Ap < 0 : Distribution décalée vers la gauche (Asymétrie Négative).
  • Ap = 0 : Distribution Symétrique (Moyenne = Médiane = Mode).

Note : Si |Ap| > 1, l'asymétrie est souvent considérée comme significative.

Moment Centré d'Ordre 3 (m3)

Le moment centré d'ordre 3 est utilisé pour évaluer l'asymétrie :

Formule

Il conserve le signe et le type d'asymétrie :

  • m3 > 0 : Distribution Asymétrique Positive (vers la droite).
  • m3 < 0 : Distribution Asymétrique Négative (vers la gauche).
  • m3 = 0 : Distribution Symétrique.

Indice d'Asymétrie de Fisher (G1)

L'indice de Fisher est une mesure d'asymétrie sans unité, dérivée du troisième moment centré :

Formule

Mesures de Kurtosis (Aplatissement)

Coefficient de Kurtosis (G2)

Formule

Le coefficient de Kurtosis mesure l'aplatissement de la distribution par rapport à la distribution normale (mésokurtique).

  • G2 > 0 : Distribution Leptokurtique (plus pointue que la normale).
  • G2 < 0 : Distribution Platykurtique (plus plate que la normale).
  • G2 = 0 : Distribution Mésokurtique (similaire à la distribution normale).

Mesures de Concentration

Les principales mesures de concentration sont l'Indice de Gini et la Courbe de Lorenz.

Types de Concentration

  • Concentration Maximale (Inégalité Totale) : X1 = X2 = X3 = .... = Xn-1 = 0 et Xn (Une seule unité détient toute la valeur).
  • Concentration Minimale (Égalité Totale) : X1 = X2 = X3 = ... = Xn (Toutes les unités détiennent une part égale).

Courbe de Lorenz

La Courbe de Lorenz est souvent utilisée pour représenter la distribution des revenus ou des richesses dans une population.

Données Nécessaires

Pour construire la courbe, on utilise généralement :

  • Produits Xini
  • Nombre d'unités (individus) Formule
  • Revenus individuels (xi)
  • Fréquences Absolues Cumulées (Ni)
  • Totaux cumulés (Ui = Ri)

Calculs clés :

  • Ui (Revenu total cumulé) : Formule
  • qi : Part relative cumulée du revenu (en %)
  • pi : Fréquence relative cumulée des unités (en %) Formule

Si pi - qi = 0, cela indique une concentration minimale (égalité parfaite).

Représentation Graphique

Plus la courbe de concentration est proche de la diagonale (ligne d'équité absolue), plus l'homogénéité (faible concentration) de la distribution est grande.

Indice de Gini (G)

L'Indice de Gini mesure la concentration des richesses. Il est égal au double de la surface de concentration (zone entre la courbe de Lorenz et la ligne d'équité).

Formule

L'indice de Gini est compris dans l'intervalle [0, 1] :

  • G = 0 : Concentration minimale (Égalité parfaite).
  • G = 1 : Concentration maximale (Inégalité totale).

Plus G est proche de 1, plus la concentration est élevée.

Entrées associées :