R에서 사분위수를 찾고 시각화하는 방법


사분위수는 데이터 세트를 4개의 동일한 부분으로 나누는 값입니다.

  • 첫 번째 사분위수는 데이터 세트의 25번째 백분위수를 나타냅니다.
  • 두 번째 사분위수는 데이터 세트의 50번째 백분위수를 나타냅니다. 이 값은 데이터 세트의 중앙값 과 동일합니다.
  • 세 번째 사분위수는 데이터 세트의 75번째 백분위수를 나타냅니다.

Quantile() 함수를 사용하면 R에서 주어진 데이터 세트의 사분위수를 쉽게 계산할 수 있습니다.

이 튜토리얼에서는 실제로 이 기능을 사용하는 방법에 대한 예를 제공합니다.

R에서 사분위수 계산

다음 코드는 R에서 주어진 데이터 세트의 사분위수를 계산하는 방법을 보여줍니다.

 #define dataset
data = c(4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33)

#calculate quartiles of dataset
quantile(data)

  0% 25% 50% 75% 100% 
 4.0 13.5 16.0 24.5 33.0 

결과를 해석하는 방법은 다음과 같습니다.

  • 첫 번째 값은 데이터 세트의 최소값인 4.0을 표시합니다.
  • 두 번째 값은 데이터세트의 첫 번째 사분위수인 13.5를 표시합니다.
  • 세 번째 값은 데이터 세트의 두 번째 사분위수인 16.0을 표시합니다.
  • 네 번째 값은 데이터 세트의 세 번째 사분위수인 24.5를 표시합니다.
  • 다섯 번째 값은 데이터세트의 최대값인 33.0을 나타냅니다.

관련 항목: R에서 백분위수를 쉽게 계산하는 방법

R에서 사분위수 시각화

boxplot() 함수를 사용하여 R에서 이 데이터 세트의 사분위수를 시각화하는 상자 그림을 만들 수 있습니다.

 #create boxplot
boxplot(data)

R에서 사분위수 시각화

상자 그림을 해석하는 방법은 다음과 같습니다.

  • 하단의 “수염”은 최소값인 4를 표시합니다.
  • 상자의 맨 아래 줄에는 첫 번째 사분위수 값 13.5 가 표시됩니다.
  • 상자 중앙의 검은색 막대는 2사분위수 값 16.0 을 표시합니다.
  • 상자의 맨 윗줄에는 3분위수 값 24.5 가 표시됩니다.
  • 위쪽 “수염”은 최대값 33.0 을 나타냅니다.

이 독특한 플롯은 데이터 세트의 값 분포를 빠르게 시각화하는 데 도움이 됩니다.

관련 항목: R의 단일 차트에 여러 상자 그림을 그리는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다