Mesures de dispersion

Dans cet article, vous découvrirez quelles sont les mesures de dispersion et à quoi servent ces métriques statistiques. De plus, vous pourrez voir comment chaque mesure de dispersion est calculée.

Que sont les mesures de dispersion ?

Les mesures de dispersion sont des mesures statistiques qui indiquent la dispersion d’un ensemble de données. Autrement dit, les mesures de dispersion sont utilisées pour évaluer le degré de dispersion des données dans un échantillon.

Les mesures de dispersion sont également appelées mesures de variabilité ou mesures de propagation .

Quelles sont les mesures de dispersion ?

Les mesures de dispersion sont les suivantes :

  • Écart type (ou écart type)
  • Variance
  • Coefficient de variation
  • Gamme
  • Gamme interquartile
  • Écart moyen

Ce qui suit explique comment déterminer chaque mesure de dispersion.

Écart-type

L’ écart type , également appelé écart typique , est égal à la racine carrée de la somme des carrés des écarts de la série de données divisée par le nombre total d’observations.

La formule de cette mesure de dispersion est donc la suivante :

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Variance

La variance est égale à la somme des carrés des résidus sur le nombre total d’observations. La formule de cette métrique de dispersion est donc la suivante :

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Où:

  • X est la variable aléatoire pour laquelle vous souhaitez calculer la variance.
  • x_i est la valeur des donnéesi .
  • n est le nombre total d’observations.
  • \overline{X} est la moyenne de la variable aléatoireX .

Coefficient de variation

En statistique, le coefficient de variation est une mesure de dispersion utilisée pour déterminer la dispersion d’un ensemble de données par rapport à sa moyenne. Le coefficient de variation est calculé en divisant l’écart type des données par sa moyenne, puis en multipliant par 100 pour exprimer la valeur en pourcentage.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Gamme

La plage est une mesure de dispersion qui indique la différence entre la valeur maximale et la valeur minimale des données dans un échantillon. Par conséquent, pour calculer l’étendue d’une population ou d’un échantillon statistique, la valeur maximale doit être soustraite de la valeur minimale.

R=\text{M\'ax}-\text{M\'in}

Gamme interquartile

L’ intervalle interquartile , également appelé intervalle interquartile , est une mesure de dispersion statistique qui indique la différence entre le troisième et le premier quartile.

Par conséquent, pour calculer l’intervalle interquartile d’un ensemble de données statistiques, vous devez d’abord trouver les troisième et premier quartiles, puis les soustraire.

IQR=Q_3-Q_1

Le symbole de l’intervalle interquartile est IQR, de l’anglais interquartile range .

L’une des caractéristiques les plus avantageuses de cette mesure de dispersion est qu’il s’agit d’une statistique robuste, c’est-à-dire qu’elle présente une grande robustesse aux valeurs aberrantes. Les valeurs extrêmes n’étant pas prises en compte dans le calcul de l’intervalle interquartile, sa valeur variera très peu si de nouvelles valeurs aberrantes apparaissent.

Écart moyen

L’ écart moyen , également appelé écart absolu moyen , est la moyenne des écarts absolus. L’écart moyen est donc égal à la somme des écarts de chaque donnée par rapport à la moyenne arithmétique divisée par le nombre total de données.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

A quoi servent les mesures de dispersion ?

Les mesures de dispersion sont utilisées pour évaluer la dispersion d’un échantillon statistique. Autrement dit, les mesures de dispersion nous permettent de quantifier la dispersion d’un ensemble de données et, à partir des valeurs obtenues, la dispersion de l’échantillon de données peut être analysée.

Les mesures de dispersion sont largement utilisées, car elles permettent de décrire un échantillon de données. Les mesures de dispersion aident à comprendre à quoi ressemble une série de données.

D’autres mesures statistiques qui sont également souvent calculées sont les mesures de tendance centrale et les mesures de position. En général, une seule mesure statistique n’est pas déterminée, mais plutôt plusieurs mesures sont prises pour mieux comprendre à quoi ressemblent les données étudiées.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *