Mesures de variabilité

Cet article explique ce que sont les mesures de variabilité et à quoi servent ces types de mesures statistiques. Ainsi, vous trouverez la définition d’une mesure de variabilité, quels sont les différents types de mesures de variabilité et comment les mesures de variabilité sont calculées.

Que sont les mesures de variabilité ?

Les mesures de variabilité sont des mesures statistiques qui indiquent la variabilité d’un ensemble de données. Autrement dit, les mesures de variabilité mesurent la dispersion d’une série de données.

Par conséquent, les mesures de variabilité sont utilisées pour connaître la dispersion des valeurs d’un échantillon. Plus la valeur d’une mesure de variabilité est élevée, cela signifie que les données de l’échantillon sont plus éloignées les unes des autres. En général, il est important que les échantillons de données soient proches les uns des autres, c’est pourquoi nous essayons normalement de minimiser les mesures de variabilité.

En statistique, les mesures de variabilité sont importantes car elles permettent de connaître la représentativité d’une mesure de centralisation sur l’ensemble de données. Si les valeurs des mesures de variabilité sont faibles, cela signifie que les données sont très concentrées et, par conséquent, les mesures de centralisation décrivent bien l’ensemble des données.

Les mesures de variabilité peuvent également être appelées mesures de dispersion ou mesures de propagation .

Quelles sont les mesures de variabilité ?

Les mesures de variabilité sont les suivantes :

  • Écart type (ou écart type)
  • Variance
  • Coefficient de variation
  • Gamme
  • Gamme interquartile
  • écart moyen

Ce qui suit explique comment calculer chaque type de mesure de variabilité

Écart-type

L’ écart type , également appelé écart typique , est égal à la racine carrée de la somme des carrés des écarts de la série de données divisée par le nombre total d’observations.

Par conséquent, la formule de cette mesure de variabilité est la suivante :

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Variance

La variance est égale à la somme des carrés des résidus sur le nombre total d’observations. La formule de cette métrique de variabilité est donc la suivante :

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Où:

  • X est la variable aléatoire pour laquelle vous souhaitez calculer la variance.
  • x_i est la valeur des donnéesi .
  • n est le nombre total d’observations.
  • \overline{X} est la moyenne de la variable aléatoireX .

Coefficient de variation

En statistique, le coefficient de variation est une mesure de variabilité utilisée pour déterminer la dispersion d’un ensemble de données par rapport à sa moyenne. Le coefficient de variation est calculé en divisant l’écart type des données par sa moyenne, puis en multipliant par 100 pour exprimer la valeur en pourcentage.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Gamme

La plage est une mesure de variabilité qui indique la différence entre la valeur maximale et la valeur minimale des données dans un échantillon. Par conséquent, pour calculer l’étendue d’une population ou d’un échantillon statistique, la valeur maximale doit être soustraite de la valeur minimale.

R=\text{M\'ax}-\text{M\'in}

Gamme interquartile

L’ intervalle interquartile , également appelé intervalle interquartile , est une mesure de variabilité statistique qui indique la différence entre le troisième et le premier quartile.

Par conséquent, pour calculer l’intervalle interquartile d’un ensemble de données statistiques, vous devez d’abord trouver les troisième et premier quartiles, puis les soustraire.

IQR=Q_3-Q_1

Le symbole de l’intervalle interquartile est IQR, de l’ intervalle interquartile anglais.

L’une des caractéristiques les plus avantageuses de cette mesure de variabilité est qu’il s’agit d’une statistique robuste, c’est-à-dire qu’elle présente une grande robustesse aux valeurs aberrantes. Les valeurs extrêmes n’étant pas prises en compte dans le calcul de l’intervalle interquartile, sa valeur variera très peu si de nouvelles valeurs aberrantes apparaissent.

écart moyen

L’ écart moyen , également appelé écart absolu moyen , est la moyenne des écarts absolus. L’écart moyen est donc égal à la somme des écarts de chaque donnée par rapport à la moyenne arithmétique divisée par le nombre total de données.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *