R의 상자 그림에서 이상값을 제거하는 방법
때로는 R의 상자 그림에서 이상값을 제거하고 싶을 수도 있습니다.
이 튜토리얼에서는 기본 R과 ggplot2를 모두 사용하여 이를 수행하는 방법을 설명합니다.
기본 R의 상자 그림에서 이상값 제거
다음과 같은 데이터 세트가 있다고 가정합니다.
data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)
다음 코드는 기본 R에서 이 데이터세트에 대한 상자 그림을 만드는 방법을 보여줍니다.
boxplot(data)

이상값을 제거하려면 outlook=FALSE 인수를 사용할 수 있습니다.
boxplot(data, outline= FALSE )

ggplot2의 상자 그림에서 이상값 제거
다음과 같은 데이터 세트가 있다고 가정합니다.
data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))
다음 코드는 ggplot2 시각화 라이브러리를 사용하여 상자 그림을 만드는 방법을 보여줍니다.
library (ggplot2) ggplot(data, aes(y=y)) + geom_boxplot ()

이상값을 제거하려면 outlier.shape=NA 인수를 사용할 수 있습니다.
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA )

ggplot2는 y축을 자동으로 조정하지 않습니다.
y축을 조정하려면 coord_cartesian을 사용할 수 있습니다.
ggplot(data, aes(y=y)) + geom_boxplot (outlier.shape = NA ) + coord_cartesian (ylim=c(5, 30))

ylim() 인수를 사용하여 지정한 대로 y축의 범위는 이제 5에서 30까지입니다.
추가 리소스
다음 튜토리얼에서는 ggplot2에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
ggplot2에서 축 제한을 설정하는 방법
ggplot2에서 병렬 플롯을 만드는 방법
ggplot2의 상자 그림에서 이상값에 레이블을 지정하는 방법