Ggplot2를 사용하여 r에서 그룹화된 상자 그림을 만드는 방법


상자 그림은 다음을 포함하는 데이터 세트의 5자리 요약을 시각화하는 데 유용합니다.

  • 최저한의
  • 첫 번째 사분위수
  • 중앙값
  • 3분위수
  • 최대

관련 항목: 상자 그림에 대한 간단한 소개

다행히도 ggplot2 시각화 라이브러리를 사용하면 R에서 상자 그림을 쉽게 만들 수 있습니다.

또한 데이터 세트의 특정 변수로 그룹화된 상자 그림을 만드는 것도 포함됩니다. 예를 들어, 두 가지 다른 훈련 프로그램을 기반으로 세 팀의 농구 선수 150명의 효율성 증가를 표시하는 다음 데이터 세트가 있다고 가정합니다.

 #define variables
team=rep(c('A', 'B', 'C'), each =50)
program=rep(c('low', 'high'), each =25)
increase=seq(1:150)+sample(1:100, 100, replace= TRUE )

#create dataset using variables
data=data.frame(team, program, increase)

#view first six rows of dataset 
head(data)

  team program increase
1 A low 62
2 A low 37
3 A low 49
4 A low 60
5 A low 64
6 A low 105

다음 코드를 사용하여 팀별로 그룹화되고 훈련 일정에 따라 채워지는 플레이어 효율성의 증가를 표시하는 상자 그림을 만들 수 있습니다.

 library (ggplot2)

ggplot(data, aes(x=team, y=increase, fill=program)) + 
  geom_boxplot ()

R의 군집 상자 그림

유사한 구문을 사용하여 훈련 프로그램별로 그룹화되고 팀별로 채워지는 플레이어 효율성의 증가를 표시하는 상자 그림을 만들 수 있습니다.

 library (ggplot2)

ggplot(data, aes(x=program, y=increase, fill=team)) + 
  geom_boxplot () 

R의 군집 상자 그림

유사한 대안은 각 하위 그룹이 자체 패널에 표시되는 패싯을 사용하는 것입니다.

 library (ggplot2)

ggplot(data, aes(x=team, y=increase, fill=program)) + 
  geom_boxplot () +
  facet_wrap (~program) 

패싯별로 그룹화된 R의 상자 그림

작업 중인 데이터에 따라 패싯 생성이 시각화 요구 사항을 충족할 수도 있고 그렇지 않을 수도 있습니다.

추가 리소스

R의 상자 그림에서 이상값을 제거하는 방법
ggplot2에서 병렬 플롯을 만드는 방법
최고의 ggplot2 테마에 대한 완벽한 가이드

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다