R의 데이터 프레임에 개수 열을 추가하는 방법
다음 기본 구문을 사용하여 R의 데이터 프레임에 “count” 열을 추가할 수 있습니다.
df %>% group_by(var1) %>% mutate(var1_count = n())
이 특정 구문은 var1 이라는 열의 값 개수를 포함하는 데이터 프레임에 var1_count 라는 열을 추가합니다.
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: R에 숫자 열 추가
다양한 농구 선수에 대한 정보를 포함하는 다음과 같은 데이터 프레임이 R에 있다고 가정합니다.
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'), position=c('G', 'F', 'F', 'F', 'G', 'G', 'F', 'F'), points=c(18, 22, 19, 14, 14, 11, 20, 28)) #view data frame df team position points 1 AG 18 2 AF 22 3 FY 19 4 BF 14 5 BG 14 6 BG 11 7 BF 20 8 BF 28
다음 코드를 사용하여 각 팀의 수를 포함하는 team_count 라는 열을 추가할 수 있습니다.
library (dplyr)
#add column that shows total count of each team
df %>%
group_by(team) %>%
mutate(team_count = n())
# A tibble: 8 x 4
# Groups: team [2]
team position points team_count
1 AG 18 3
2 AF 22 3
3 FY 19 3
4 BF 14 5
5 BG 14 5
6 BG 11 5
7 BF 20 5
8 BF 28 5
팀 값이 A인 라인이 3개 있고 팀 값이 B인 라인이 5 개 있습니다.
그래서:
- 팀이 A인 각 행에 대해 team_count 열의 값은 3 입니다.
- 팀이 B인 각 행에 대해 team_count 열의 값은 5 입니다.
여러 변수를 함께 그룹화하는 “계정” 열을 추가할 수도 있습니다.
예를 들어, 다음 코드는 팀 및 직위 변수를 그룹화하는 “계정” 열을 추가하는 방법을 보여줍니다.
library (dplyr)
#add column that shows total count of each team and position
df %>%
group_by(team, position) %>%
mutate(team_pos_count = n())
# A tibble: 8 x 4
# Groups: team, position [4]
team position points team_pos_count
1 AG 18 1
2 AF 22 2
3 FY 19 2
4 BF 14 3
5 BG 14 2
6 BG 11 2
7 BF 20 3
8 BF 28 3
결과에서 우리는 다음을 볼 수 있습니다:
- 팀 열에 A가 포함되고 위치 열에 G가 포함된 행이 1 개 있습니다.
- 팀 열에 A가 포함되고 위치 열에 F가 포함된 2개의 행이 있습니다.
- 팀 열에 B가 포함되고 위치 열에 F가 포함된 3개의 행이 있습니다.
- 팀 열에 B가 포함되고 위치 열에 F가 포함된 2개의 행이 있습니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 조건에 따라 그룹화하고 계산하는 방법
R 목록의 요소 수를 계산하는 방법
R의 데이터 프레임에서 단일 행을 선택하는 방법