R의 단일 그래프에 여러 상자 그림을 그리는 방법


상자 그림 (상자 수염 그림이라고도 함)은 데이터 세트의 5개 숫자 요약을 표시하는 그림입니다.

5개 숫자 요약에는 다음이 포함됩니다.

  • 최소값
  • 첫 번째 사분위수
  • 중앙값
  • 3분위수
  • 최대값

이 튜토리얼에서는 Base R 및 ggplot2를 사용하여 R의 단일 플롯에 여러 상자 그림을 그리는 방법을 설명합니다.

R 기반 상자 그림

R에서 상자 그림을 만드는 방법을 설명하기 위해 R에 내장된 대기 질 데이터 세트를 사용하여 작업합니다.

 #view first 6 rows of "air quality" dataset
head(airquality)

#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6

“오존” 변수에 대한 단일 상자 그림을 만들려면 다음 구문을 사용할 수 있습니다.

 #create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)

그러면 다음 상자 그림이 생성됩니다.

대신 데이터 세트의 각 월에 대한 상자 그림을 생성한다고 가정해 보겠습니다. 다음 구문은 이를 수행하는 방법을 보여줍니다.

 #create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)

그러면 매월 상자 그림을 표시하는 다음 차트가 생성됩니다.

ggplot2의 상자 그림

R에서 상자 그림을 만드는 또 다른 방법은 ggplot2 패키지를 사용하는 것입니다. 다음 예에서는 내장된 공기 질 데이터 세트를 다시 사용합니다.

대기 질 데이터 세트의 “오존” 변수에 대한 단일 상자 그림을 만들려면 다음 구문을 사용할 수 있습니다.

 #create boxplot for the variable “Ozone”
library(ggplot2)

ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()

그러면 다음 상자 그림이 생성됩니다.

대신 데이터 세트의 각 월에 대한 상자 그림을 생성하려면 다음 구문을 사용하면 됩니다.

 #create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)

ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
    geom_boxplot(fill="steelblue") +
    labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")

그러면 매월 상자 그림을 표시하는 다음 차트가 생성됩니다.

추가 리소스

다음 자습서에서는 상자 그림에 대한 추가 정보를 제공합니다.

언제 상자 그림을 사용해야 합니까? (시나리오 3개)
상자 그림에서 비대칭성을 식별하는 방법
상자 그림을 비교하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다