R에서 tapply() 함수를 사용하는 방법(예제 포함)
R의 tapply() 함수는 다른 벡터로 그룹화된 벡터에 함수를 적용하는 데 사용할 수 있습니다.
이 함수는 다음 기본 구문을 사용합니다.
태퍼(X, INDEX, FUN, ..)
금:
- X : 함수를 적용할 벡터
- INDEX : 그룹화할 벡터
- FUN : 적용할 기능
다음 예에서는 R의 다음 데이터 프레임에서 실제로 이 함수를 사용하는 방법을 보여줍니다.
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
points=c(14, 19, 13, 8, 15, 15, 17, 19),
assists=c(4, 3, 3, 5, 9, 14, 15, 12))
#view data frame
df
team position points assists
1 AG 14 4
2 AG 19 3
3 AF 13 3
4 AF 8 5
5 BG 15 9
6 BG 15 14
7 BF 17 15
8 BF 19 12
예시 1: 변수별로 그룹화된 변수에 함수 적용
다음 코드는 tapply() 함수를 사용하여 팀별 로 그룹화된 평균 점수 를 계산하는 방법을 보여줍니다.
#calculate mean of points, grouped by team
tapply(df$points, df$team, mean)
AB
13.5 16.5
결과에서 우리는 다음을 볼 수 있습니다:
- A팀의 평균 점수는 13.5 이다.
- B팀의 평균 점수는 16.5 이다.
데이터 프레임에서 NA 값을 무시하면서 평균을 계산한다는 것을 나타내기 위해 함수 뒤에 na.rm 과 같은 추가 인수를 포함할 수도 있습니다.
#calculate mean of points, grouped by team
tapply(df$points, df$team, mean, na. rm = TRUE )
AB
13.5 16.5
예시 2: 여러 변수로 그룹화된 변수에 함수 적용
다음 코드는 tapply() 함수를 사용하여 팀 및 위치 별로 그룹화된 평균 점수 값을 계산하는 방법을 보여줍니다.
# calculate mean of points, grouped by team and position
tapply(df$points, list(df$team, df$position), mean, na. rm = TRUE )
FG
A 10.5 16.5
B 18.0 15.0
결과에서 우리는 다음을 볼 수 있습니다:
- A 팀과 F 포지션의 평균 점수는 10.5 입니다.
- A 팀과 G 포지션의 평균 점수는 16.5 입니다.
- B팀과 F포지션의 평균점수는 18.0 이다.
- B팀과 G포지션의 평균점수는 15.0 이다.
참고 : 이 예에서는 두 개의 변수로 그룹화했지만 list() 함수에 원하는 만큼 많은 변수를 포함하여 더 많은 변수를 그룹화할 수 있습니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 기능을 사용하는 방법을 설명합니다.
R에서 Dim() 함수를 사용하는 방법
R에서 table() 함수를 사용하는 방법
R에서 sign() 함수를 사용하는 방법