Comment supprimer les valeurs aberrantes dans les boxplots dans R



Parfois, vous souhaiterez peut-être supprimer les valeurs aberrantes des boxplots dans R.

Ce tutoriel explique comment procéder en utilisant à la fois base R et ggplot2 .

Supprimer les valeurs aberrantes dans les boxplots en Base R

Supposons que nous ayons l’ensemble de données suivant :

data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

Le code suivant montre comment créer un boxplot pour cet ensemble de données en base R :

boxplot(data)

Pour supprimer les valeurs aberrantes, vous pouvez utiliser l’argument outline=FALSE :

boxplot(data, outline=FALSE)

Boxplot avec valeur aberrante supprimée dans R

Supprimer les valeurs aberrantes dans les boxplots dans ggplot2

Supposons que nous ayons l’ensemble de données suivant :

data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

Le code suivant montre comment créer un boxplot à l’aide de la bibliothèque de visualisation ggplot2 :

library(ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot()

Pour supprimer les valeurs aberrantes, vous pouvez utiliser l’argument outlier.shape=NA :

ggplot(data, aes(y=y)) +
  geom_boxplot(outlier.shape = NA)

Boîte à moustaches ggplot2 avec valeurs aberrantes supprimées

Notez que ggplot2 n’ajuste pas automatiquement l’axe y.

Pour ajuster l’axe y, vous pouvez utiliser coord_cartesian :

ggplot(data, aes(y=y)) +
  geom_boxplot(outlier.shape = NA) +
  coord_cartesian(ylim=c(5, 30))

boxplot ggplot2 sans valeurs aberrantes

L’axe y va désormais de 5 à 30, comme nous l’avons spécifié en utilisant l’argument ylim() .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans ggplot2 :

Comment définir les limites de l’axe dans ggplot2
Comment créer des tracés côte à côte dans ggplot2
Comment étiqueter les valeurs aberrantes dans les boxplots dans ggplot2

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *