Comment interpréter l’intervalle interquartile : avec des exemples



L’ intervalle interquartile d’un ensemble de données, souvent abrégé IQR, est la différence entre le premier quartile (le 25e centile) et le troisième quartile (le 75e centile) de l’ensemble de données.

En termes simples, il mesure l’écart entre les 50 % moyens des valeurs.

IQR = Q3 – Q1

Par exemple, supposons que nous disposions de l’ensemble de données suivant qui montre la hauteur de 17 plantes différentes (en pouces) dans un laboratoire :

Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Selon le calculateur d’intervalle interquartile , l’intervalle interquartile (IQR) pour cet ensemble de données est calculé comme suit :

  • T1 : 12
  • T3 : 26,5
  • IQR = Q3 – Q1 = 14,5

Cela nous indique que les 50 % centraux des valeurs de l’ensemble de données ont un écart de 14,5 pouces.

Pourquoi l’intervalle interquartile est utile

L’intervalle interquartile est un moyen de mesurer la répartition des valeurs dans un ensemble de données, mais il existe d’autres mesures de répartition telles que :

  • Plage : mesure la différence entre la valeur minimale et maximale dans un ensemble de données.
  • Écart type : mesure l’écart typique des valeurs individuelles par rapport à la valeur moyenne dans un ensemble de données.

L’avantage de l’utilisation de l’intervalle interquartile (IQR) pour mesurer la répartition des valeurs dans un ensemble de données est qu’il n’est pas affecté par les valeurs aberrantes extrêmes.

Par exemple, une valeur extrêmement petite ou extrêmement grande dans un ensemble de données n’affectera pas le calcul de l’IQR car l’IQR utilise uniquement les valeurs du 25e centile et du 75e centile de l’ensemble de données.

Pour illustrer cela, considérons l’ensemble de données suivant :

Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Cet ensemble de données comporte les mesures de propagation suivantes

  • IQR : 14,5
  • Écart type : 9,25
  • Portée : 31

Cependant, considérez si l’ensemble de données présentait une valeur aberrante extrême :

Ensemble de données : 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Nous pourrions utiliser une calculatrice pour trouver les mesures de propagation suivantes pour cet ensemble de données :

  • IQR : 15
  • Écart type : 85,02
  • Portée : 377

Notez que l’intervalle interquartile change à peine lorsqu’une valeur aberrante est présente, tandis que l’écart type et l’intervalle changent tous deux de façon spectaculaire.

Comparaison des plages interquartiles entre les ensembles de données

L’intervalle interquartile peut également être utilisé pour comparer la répartition des valeurs entre différents ensembles de données.

Par exemple, supposons que nous ayons trois ensembles de données avec les valeurs IQR suivantes :

  • IQR de l’ensemble de données 1 : 13,5
  • IQR de l’ensemble de données 2 : 24,4
  • IQR de l’ensemble de données 3 : 8,7

Cela nous indique que l’écart entre les 50 % intermédiaires des valeurs est le plus grand pour l’ensemble de données 2 et le plus petit pour l’ensemble de données 3.

Ressources additionnelles

Comment calculer l’intervalle interquartile dans Excel
Comment calculer l’intervalle interquartile en Python
Comment trouver les valeurs aberrantes à l’aide de l’intervalle interquartile
Calculateur d’intervalle interquartile

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *