Formules et Concepts Clés en Statistiques Descriptives
Classé dans Physique
Écrit le en
français avec une taille de 94,71 KB
Mesures de Tendance Centrale
Moyenne Arithmétique
La moyenne arithmétique est calculée selon le type de données :
Cas d'application de la Moyenne Arithmétique
- Données regroupées par intervalles (xi = centre de classe).
- Données non regroupées (tableau de fréquences simples).
- Données groupées (tableaux).
Médiane (Me)
La médiane est la valeur centrale d'une série de données ordonnées. Les observations doivent être ordonnées par ordre croissant.
- Si n est pair :
- Si n est impair :
La médiane est la valeur qui occupe la position centrale dans la série ordonnée.
Mode (Mo)
Le mode est la valeur qui est répétée le plus souvent dans la série de données (la valeur ayant la fréquence la plus élevée).
Milieu de Gamme (RM)
Le milieu de gamme (ou étendue médiane) est calculé comme suit :
Autres Mesures de Tendance Centrale et Quantiles
- Moyenne Géométrique (G) :
- Moyenne Harmonique (H) :
- Moyenne Quadratique (Q) :
Quantiles
Centile :
K-ième Centile :
Mesures de Dispersion
Étendue (Re)
L'étendue (Range) est la différence entre la valeur maximale et la valeur minimale :
Variance (S²)
La variance mesure la dispersion des données autour de la moyenne.
- Formule théorique :
- Formule de calcul :
Propriétés de la Variance
- V(x)
0 (La variance est toujours positive ou nulle).
- Changement d'origine : La variance ne change pas.
- Changement d'échelle : V(kX) = k² * V(X).
- V(k) = 0 (La variance d'une constante est nulle).
Écart-Type
L'écart-type est la racine carrée positive de la variance :
Écart Interquartile
L'écart interquartile (EI) est la différence entre le troisième quartile (Q3) et le premier quartile (Q1) :
EI = Q3 - Q1
Taux d'Ouverture
Coefficient de Variation (CV)
Le Coefficient de Variation est une mesure de dispersion relative, souvent exprimée en pourcentage :
CV (%) = (Écart-type / Moyenne arithmétique)
Interprétation :
- Plus le CV est élevé, plus les données sont dispersées.
- Le CV n'est pas toujours positif si la moyenne est négative (bien que l'écart-type soit toujours positif).
Moments Statistiques
Moments d'Ordre r par Rapport à l'Origine
Formule générale :
Moments Centrés (par Rapport à la Moyenne)
Formule générale :
Exemples de Moments Centrés
- Moment centré de second ordre (Variance) :
Mesures de Forme : Asymétrie (Skewness) et Kurtosis
Mesures d'Asymétrie
Coefficient d'Asymétrie de Pearson (Ap)
Plus la valeur absolue de Ap est grande, plus l'asymétrie est prononcée.
- Ap > 0 : Distribution décalée vers la droite (Asymétrie Positive).
- Ap < 0 : Distribution décalée vers la gauche (Asymétrie Négative).
- Ap = 0 : Distribution Symétrique (Moyenne = Médiane = Mode).
Note : Si |Ap| > 1, l'asymétrie est souvent considérée comme significative.
Moment Centré d'Ordre 3 (m3)
Le moment centré d'ordre 3 est utilisé pour évaluer l'asymétrie :
Il conserve le signe et le type d'asymétrie :
- m3 > 0 : Distribution Asymétrique Positive (vers la droite).
- m3 < 0 : Distribution Asymétrique Négative (vers la gauche).
- m3 = 0 : Distribution Symétrique.
Indice d'Asymétrie de Fisher (G1)
L'indice de Fisher est une mesure d'asymétrie sans unité, dérivée du troisième moment centré :
Mesures de Kurtosis (Aplatissement)
Coefficient de Kurtosis (G2)
Le coefficient de Kurtosis mesure l'aplatissement de la distribution par rapport à la distribution normale (mésokurtique).
- G2 > 0 : Distribution Leptokurtique (plus pointue que la normale).
- G2 < 0 : Distribution Platykurtique (plus plate que la normale).
- G2 = 0 : Distribution Mésokurtique (similaire à la distribution normale).
Mesures de Concentration
Les principales mesures de concentration sont l'Indice de Gini et la Courbe de Lorenz.
Types de Concentration
- Concentration Maximale (Inégalité Totale) : X1 = X2 = X3 = .... = Xn-1 = 0 et Xn (Une seule unité détient toute la valeur).
- Concentration Minimale (Égalité Totale) : X1 = X2 = X3 = ... = Xn (Toutes les unités détiennent une part égale).
Courbe de Lorenz
La Courbe de Lorenz est souvent utilisée pour représenter la distribution des revenus ou des richesses dans une population.
Données Nécessaires
Pour construire la courbe, on utilise généralement :
- Produits Xini
- Nombre d'unités (individus)
- Revenus individuels (xi)
- Fréquences Absolues Cumulées (Ni)
- Totaux cumulés (Ui = Ri)
Calculs clés :
- Ui (Revenu total cumulé) :
- qi : Part relative cumulée du revenu (en %)
- pi : Fréquence relative cumulée des unités (en %)
Si pi - qi = 0, cela indique une concentration minimale (égalité parfaite).
Représentation Graphique
Plus la courbe de concentration est proche de la diagonale (ligne d'équité absolue), plus l'homogénéité (faible concentration) de la distribution est grande.
Indice de Gini (G)
L'Indice de Gini mesure la concentration des richesses. Il est égal au double de la surface de concentration (zone entre la courbe de Lorenz et la ligne d'équité).
L'indice de Gini est compris dans l'intervalle [0, 1] :
- G = 0 : Concentration minimale (Égalité parfaite).
- G = 1 : Concentration maximale (Inégalité totale).
Plus G est proche de 1, plus la concentration est élevée.