Comment calculer l’intervalle interquartile dans R (avec exemples)



L’ intervalle interquartile représente la différence entre le premier quartile (le 25e centile) et le troisième quartile (le 75e centile) d’un ensemble de données.

En termes simples, il mesure l’écart entre les 50 % moyens des valeurs.

IQR = Q3 – Q1

Nous pouvons utiliser la fonction intégrée IQR() pour calculer l’intervalle interquartile d’un ensemble de valeurs dans R :

IQR(x)

Les exemples suivants montrent comment utiliser cette fonction dans la pratique.

Exemple 1 : intervalle interquartile d’un vecteur

Le code suivant montre comment calculer la plage interquartile de valeurs dans un vecteur :

#define vector
x <- c(4, 6, 6, 7, 8, 12, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x)

[1] 14.5

Exemple 2 : intervalle interquartile d’un vecteur avec des valeurs manquantes

Si votre vecteur comporte des valeurs manquantes, veillez à spécifier na.rm=TRUE pour ignorer les valeurs manquantes lors du calcul de l’intervalle interquartile :

#define vector with some missing values
x <- c(4, 6, NA, 7, NA, NA, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x, na.rm=TRUE)

[1] 10.25

Exemple 3 : intervalle interquartile de colonne dans un bloc de données

Le code suivant montre comment calculer l’intervalle interquartile d’une colonne spécifique dans un bloc de données :

#define data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1' column
IQR(df$var1)

[1] 1

Exemple 4 : plage interquartile de plusieurs colonnes dans un bloc de données

Le code suivant montre comment calculer l’intervalle interquartile de plusieurs colonnes dans un bloc de données :

#define data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1', 'var2', and 'var4' columns
sapply(df[ , c('var1', 'var2', 'var4')], IQR)

var1 var2 var4 
   1    4    7

Ressources additionnelles

Comment trouver la plage dans R
Comment calculer l’écart type dans R
Comment interpréter l’intervalle interquartile
Écart interquartile et écart type : quelle est la différence ?

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *