Como remover outliers em boxplots em r


Às vezes você pode querer remover valores discrepantes de boxplots em R.

Este tutorial explica como fazer isso usando base R e ggplot2 .

Remover valores discrepantes em boxplots na Base R

Suponha que temos o seguinte conjunto de dados:

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

O código a seguir mostra como criar um boxplot para este conjunto de dados na base R:

 boxplot(data)

Para remover valores discrepantes, você pode usar o argumento outline=FALSE :

 boxplot(data, outline= FALSE ) 

Boxplot com outlier removido em R

Remova valores discrepantes em boxplots no ggplot2

Suponha que temos o seguinte conjunto de dados:

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

O código a seguir mostra como criar um boxplot usando a biblioteca de visualização ggplot2:

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

Para remover valores discrepantes, você pode usar o argumento outlier.shape=NA :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

boxplot ggplot2 com outliers removidos

Observe que o ggplot2 não ajusta automaticamente o eixo y.

Para ajustar o eixo y você pode usar coord_cartesian :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

boxplot ggplot2 sem outliers

O eixo y agora varia de 5 a 30, conforme especificamos usando o argumento ylim() .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns no ggplot2:

Como definir limites de eixo no ggplot2
Como criar gráficos lado a lado no ggplot2
Como rotular outliers em boxplots no ggplot2

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *