R에서 다섯 숫자의 요약을 계산하는 방법(예제 포함)


5자리 요약은 다음 5개 값을 사용하여 데이터 세트를 요약하는 방법입니다.

  • 최저한의
  • 첫 번째 사분위수
  • 중앙값
  • 3분위수
  • 최대

5개 숫자 요약은 다음과 같이 데이터 분포에 대한 간결한 요약을 제공하므로 유용합니다.

  • 중앙값을 사용하여 중앙값이 어디에 있는지 알려줍니다.
  • 이는 첫 번째 및 세 번째 사분위수를 사용하여 데이터의 분포를 알려줍니다.
  • 최소값과 최대값을 사용하여 데이터의 범위를 알려줍니다.

R에서 데이터 세트의 5개 숫자 요약을 계산하는 가장 간단한 방법은 R 베이스의 fivenum() 함수를 사용하는 것입니다.

 fivenum(data)

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예 1: 벡터의 5개 숫자 요약

다음 코드는 R에서 숫자 벡터의 5개 숫자 요약을 계산하는 방법을 보여줍니다.

 #define numeric vector
data <- c(4, 6, 6, 7, 8, 9, 12, 13, 14, 15, 15, 18, 22)

#calculate five number summary of data
fivenum(data)

[1] 4 7 12 15 22

결과에서 우리는 다음을 볼 수 있습니다:

  • 최소: 4
  • 첫 번째 사분위수: 7
  • 중앙값: 12
  • 3분위수: 15
  • 최대: 22

상자 그림을 생성하여 5자리 요약을 빠르게 시각화할 수 있습니다.

 boxplot(data)

[1] 4 7 12 15 22 

상자 그림을 해석하는 방법은 다음과 같습니다.

  • 그래프 하단의 선은 최소값( 4 )을 나타냅니다.
  • 상자 하단의 선은 1사분위수( 7 )를 나타냅니다.
  • 상자 중앙의 선은 중앙값( 12 )을 나타냅니다.
  • 상자 상단의 선은 3분위수( 15 )를 나타냅니다.
  • 그래프 상단의 선은 최대값( 22 )을 나타냅니다.

예 2: 데이터 프레임 열의 5자리 요약

다음 코드는 데이터 프레임의 특정 열에 대한 5자리 요약을 계산하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points column
fivenum(df$points)

[1] 85.0 86.5 88.5 92.5 99.0

예시 3: 여러 열의 5자리 요약

다음 코드는 sapply() 함수를 사용하여 데이터 프레임에 있는 여러 열의 5자리 요약을 동시에 계산하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points, assists, and rebounds column
sapply(df[c(' points ', ' assists ', ' rebounds ')], fivenum)

     points assists rebounds
[1,] 85.0 25.0 24.0
[2,] 86.5 28.5 26.0
[3,] 88.5 30.5 29.0
[4,] 92.5 33.5 30.5
[5,] 99.0 39.0 35.0

관련: R의 apply(), lapply(), sapply() 및 tapply()에 대한 가이드

추가 리소스

R에서 요약 테이블을 만드는 방법
R에서 범위를 찾는 방법
R에서 이상값을 제거하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다