R에서 여러 열을 집계하는 방법(예제 포함)
R의 Aggregate() 함수를 사용하여 데이터 프레임에 있는 하나 이상의 변수에 대한 요약 통계를 생성할 수 있습니다.
이 함수는 다음 기본 구문을 사용합니다.
집계(sum_var ~ group_var, 데이터 = df, FUN = 평균)
금:
- sum_var : 요약할 변수
- group_var : 그룹화할 변수
- 데이터: 데이터 블록의 이름
- FUN: 계산할 요약 통계
이 튜토리얼에서는 다음 데이터 프레임을 예로 들어 이 함수를 사용하여 R에서 한 번에 하나 이상의 열을 집계하는 몇 가지 예를 제공합니다.
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'), conf=c('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'), points=c(1, 3, 3, 4, 5, 7, 7, 9), rebounds=c(7, 7, 8, 3, 2, 7, 14, 13)) #view data frame df team conf points rebounds 1 AE 1 7 2 AE 3 7 3 AW 3 8 4 BW 4 3 5 BW 5 2 6 BW 7 7 7 CW 7 14 8 CW 9 13
예시 1: 변수 요약 및 변수별 그룹화
다음 코드는 팀별로 그룹화된 평균 득점 점수를 찾는 방법을 보여줍니다.
#find mean points scored, grouped by team aggregate(points ~ team, data = df, FUN = mean, na. rm = TRUE ) team points 1 A 2.333333 2 B 5.333333 3 C 8.000000
예시 2: 변수 요약 및 여러 변수별 그룹화
다음 코드는 팀 및 컨퍼런스별로 그룹화되어 득점된 평균 점수를 찾는 방법을 보여줍니다.
#find mean points scored, grouped by team and conference aggregate(points ~ team + conf, data = df, FUN = mean, na. rm = TRUE ) team conf points 1 AE 2.000000 2 AW 3.000000 3 BW 5.333333 4 CW 8.000000
예시 3: 여러 변수를 요약하고 하나의 변수로 그룹화
다음 코드는 팀별로 그룹화된 득점 평균과 리바운드 평균을 찾는 방법을 보여줍니다.
#find mean points scored, grouped by team and conference aggregate( cbind (points,rebounds) ~ team, data = df, FUN = mean, na. rm = TRUE ) team points rebounds 1 A 2.333333 7.333333 2 B 5.333333 4.000000 3 C 8.000000 13.500000
예시 4: 여러 변수를 요약하고 여러 변수별로 그룹화
다음 코드는 팀 및 컨퍼런스별로 그룹화된 득점 평균 및 리바운드 평균을 찾는 방법을 보여줍니다.
#find mean points scored, grouped by team and conference aggregate( cbind (points,rebounds) ~ team + conf, data = df, FUN = mean, na. rm = TRUE ) team conf points rebounds 1 AE 2.000000 7.0 2AW 3.000000 8.0 3 BW 5.333333 4.0 4 CW 8.000000 13.5