Écart interquartile et écart type : quelle est la différence ?



L’ intervalle interquartile et l’ écart type sont deux façons de mesurer la répartition des valeurs dans un ensemble de données.

Ce didacticiel fournit une brève explication de chaque métrique ainsi que les similitudes et les différences entre les deux.

Gamme interquartile

L’ intervalle interquartile (IQR) d’un ensemble de données est la différence entre le premier quartile (le 25e centile) et le troisième quartile (le 75e centile). Il mesure la répartition des 50 % moyens des valeurs.

IQR = Q3 – Q1

Par exemple, supposons que nous ayons l’ensemble de données suivant :

Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Selon le calculateur d’intervalle interquartile , l’intervalle interquartile (IQR) pour cet ensemble de données est calculé comme suit :

  • T1 : 12
  • T3 : 26,5
  • IQR = Q3 – Q1 = 14,5

Cela nous indique que les 50 % intermédiaires des valeurs de l’ensemble de données ont un écart de 14,5 .

Écart-type

L’ écart type d’un ensemble de données est un moyen de mesurer l’écart typique des valeurs individuelles par rapport à la valeur moyenne. Il est calculé comme suit :

s = √(Σ(x jex ) 2 / (n-1))

Par exemple, supposons que nous ayons l’ensemble de données suivant :

Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Nous pouvons utiliser une calculatrice pour constater que l’écart type de cet ensemble de données est de 9,25 . Cela nous donne une idée de la distance entre la valeur typique et la moyenne.

Similitudes et différences

L’intervalle interquartile et l’écart type partagent la similitude suivante :

  • Les deux métriques mesurent la répartition des valeurs dans un ensemble de données.

Cependant, l’intervalle interquartile et l’écart type présentent la différence clé suivante :

  • L’intervalle interquartile (IQR) n’est pas affecté par les valeurs aberrantes extrêmes. Par exemple, une valeur extrêmement petite ou extrêmement grande dans un ensemble de données n’affectera pas le calcul de l’IQR car l’IQR utilise uniquement les valeurs du 25e centile et du 75e centile de l’ensemble de données.
  • L’écart type est affecté par les valeurs aberrantes extrêmes. Par exemple, une valeur extrêmement grande dans un ensemble de données entraînera un écart type beaucoup plus grand puisque l’écart type utilise chaque valeur d’un ensemble de données dans sa formule.

Quand utiliser chacun

Vous devez utiliser l’intervalle interquartile pour mesurer la répartition des valeurs dans un ensemble de données lorsqu’il existe des valeurs aberrantes extrêmes.

À l’inverse, vous devez utiliser l’écart type pour mesurer la répartition des valeurs lorsqu’il n’y a pas de valeurs aberrantes extrêmes.

Pour illustrer pourquoi, considérons l’ensemble de données suivant :

Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Plus tôt dans l’article, nous avons calculé les métriques suivantes pour cet ensemble de données :

  • IQR : 14,5
  • Écart type : 9,25

Cependant, considérez si l’ensemble de données présentait une valeur aberrante extrême :

Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Nous pourrions utiliser une calculatrice pour trouver les métriques suivantes pour cet ensemble de données :

  • IQR : 15
  • Écart type : 85,02

Notez que l’intervalle interquartile change à peine lorsqu’une valeur aberrante est présente, tandis que l’écart type augmente de 9,25 jusqu’à 85,02.

Ressources additionnelles

Mesures de tendance centrale : définition et exemples
Mesures de dispersion : définition et exemples
Comment trouver les valeurs aberrantes à l’aide de l’intervalle interquartile

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *