R의 상자 그림에서 이상값을 제거하는 방법


때로는 R의 상자 그림에서 이상값을 제거하고 싶을 수도 있습니다.

이 튜토리얼에서는 기본 R과 ggplot2를 모두 사용하여 이를 수행하는 방법을 설명합니다.

기본 R의 상자 그림에서 이상값 제거

다음과 같은 데이터 세트가 있다고 가정합니다.

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

다음 코드는 기본 R에서 이 데이터세트에 대한 상자 그림을 만드는 방법을 보여줍니다.

 boxplot(data)

이상값을 제거하려면 outlook=FALSE 인수를 사용할 수 있습니다.

 boxplot(data, outline= FALSE ) 

R에서 이상치가 제거된 상자 그림

ggplot2의 상자 그림에서 이상값 제거

다음과 같은 데이터 세트가 있다고 가정합니다.

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

다음 코드는 ggplot2 시각화 라이브러리를 사용하여 상자 그림을 만드는 방법을 보여줍니다.

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

이상값을 제거하려면 outlier.shape=NA 인수를 사용할 수 있습니다.

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

이상치가 제거된 ggplot2 boxplot

ggplot2는 y축을 자동으로 조정하지 않습니다.

y축을 조정하려면 coord_cartesian을 사용할 수 있습니다.

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

이상값 없는 boxplot ggplot2

ylim() 인수를 사용하여 지정한 대로 y축의 범위는 이제 5에서 30까지입니다.

추가 리소스

다음 튜토리얼에서는 ggplot2에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

ggplot2에서 축 제한을 설정하는 방법
ggplot2에서 병렬 플롯을 만드는 방법
ggplot2의 상자 그림에서 이상값에 레이블을 지정하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다