Comment supprimer les valeurs aberrantes dans les boxplots dans R
Parfois, vous souhaiterez peut-être supprimer les valeurs aberrantes des boxplots dans R.
Ce tutoriel explique comment procéder en utilisant à la fois base R et ggplot2 .
Supprimer les valeurs aberrantes dans les boxplots en Base R
Supposons que nous ayons l’ensemble de données suivant :
data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)
Le code suivant montre comment créer un boxplot pour cet ensemble de données en base R :
boxplot(data)
Pour supprimer les valeurs aberrantes, vous pouvez utiliser l’argument outline=FALSE :
boxplot(data, outline=FALSE)
Supprimer les valeurs aberrantes dans les boxplots dans ggplot2
Supposons que nous ayons l’ensemble de données suivant :
data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))
Le code suivant montre comment créer un boxplot à l’aide de la bibliothèque de visualisation ggplot2 :
library(ggplot2) ggplot(data, aes(y=y)) + geom_boxplot()
Pour supprimer les valeurs aberrantes, vous pouvez utiliser l’argument outlier.shape=NA :
ggplot(data, aes(y=y)) + geom_boxplot(outlier.shape = NA)
Notez que ggplot2 n’ajuste pas automatiquement l’axe y.
Pour ajuster l’axe y, vous pouvez utiliser coord_cartesian :
ggplot(data, aes(y=y)) + geom_boxplot(outlier.shape = NA) + coord_cartesian(ylim=c(5, 30))
L’axe y va désormais de 5 à 30, comme nous l’avons spécifié en utilisant l’argument ylim() .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans ggplot2 :
Comment définir les limites de l’axe dans ggplot2
Comment créer des tracés côte à côte dans ggplot2
Comment étiqueter les valeurs aberrantes dans les boxplots dans ggplot2