R에서 사분위수를 찾고 시각화하는 방법
사분위수는 데이터 세트를 4개의 동일한 부분으로 나누는 값입니다.
- 첫 번째 사분위수는 데이터 세트의 25번째 백분위수를 나타냅니다.
- 두 번째 사분위수는 데이터 세트의 50번째 백분위수를 나타냅니다. 이 값은 데이터 세트의 중앙값 과 동일합니다.
- 세 번째 사분위수는 데이터 세트의 75번째 백분위수를 나타냅니다.
Quantile() 함수를 사용하면 R에서 주어진 데이터 세트의 사분위수를 쉽게 계산할 수 있습니다.
이 튜토리얼에서는 실제로 이 기능을 사용하는 방법에 대한 예를 제공합니다.
R에서 사분위수 계산
다음 코드는 R에서 주어진 데이터 세트의 사분위수를 계산하는 방법을 보여줍니다.
#define dataset data = c(4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33) #calculate quartiles of dataset quantile(data) 0% 25% 50% 75% 100% 4.0 13.5 16.0 24.5 33.0
결과를 해석하는 방법은 다음과 같습니다.
- 첫 번째 값은 데이터 세트의 최소값인 4.0을 표시합니다.
- 두 번째 값은 데이터세트의 첫 번째 사분위수인 13.5를 표시합니다.
- 세 번째 값은 데이터 세트의 두 번째 사분위수인 16.0을 표시합니다.
- 네 번째 값은 데이터 세트의 세 번째 사분위수인 24.5를 표시합니다.
- 다섯 번째 값은 데이터세트의 최대값인 33.0을 나타냅니다.
관련 항목: R에서 백분위수를 쉽게 계산하는 방법
R에서 사분위수 시각화
boxplot() 함수를 사용하여 R에서 이 데이터 세트의 사분위수를 시각화하는 상자 그림을 만들 수 있습니다.
#create boxplot
boxplot(data)
상자 그림을 해석하는 방법은 다음과 같습니다.
- 하단의 “수염”은 최소값인 4를 표시합니다.
- 상자의 맨 아래 줄에는 첫 번째 사분위수 값 13.5 가 표시됩니다.
- 상자 중앙의 검은색 막대는 2사분위수 값 16.0 을 표시합니다.
- 상자의 맨 윗줄에는 3분위수 값 24.5 가 표시됩니다.
- 위쪽 “수염”은 최대값 33.0 을 나타냅니다.
이 독특한 플롯은 데이터 세트의 값 분포를 빠르게 시각화하는 데 도움이 됩니다.
관련 항목: R의 단일 차트에 여러 상자 그림을 그리는 방법