R에서 중복을 계산하는 방법: 예 포함
다음 방법을 사용하여 R의 데이터 프레임에서 중복 항목을 계산할 수 있습니다.
방법 1: 열의 중복 값 계산
sum(duplicated(df$my_column))
방법 2: 중복 행 계산
nrow(df[duplicated(df), ])
방법 3: 각 고유 행의 중복 횟수 계산
library (dplyr)
df %>% group_by_all() %>% count
다음 예에서는 R의 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.
#create data frame
df = data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
position=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'),
points=c(5, 5, 8, 10, 5, 7, 10, 10))
#view data frame
df
team position points
1 GA 5
2 AG 5
3 AG 8
4 AF 10
5 BG 5
6 BG 7
7 BF 10
8 BF 10
예시 1: 열의 중복 값 계산
다음 코드는 포인트 열의 중복 값 수를 계산하는 방법을 보여줍니다.
#count number of duplicate values in points column
sum(duplicated(df$points))
[1] 4
포인트 열에 4개의 중복된 값이 있는 것을 볼 수 있습니다.
예시 2: 중복 행 계산
다음 코드는 데이터 프레임에서 중복 행 수를 계산하는 방법을 보여줍니다.
#count number of duplicate rows
nrow(df[duplicated(df), ])
[1] 2
데이터 프레임에 2개의 중복 행이 있는 것을 볼 수 있습니다.
다음 구문을 사용하여 2개의 중복 라인을 표시할 수 있습니다.
#display duplicated rows
df[duplicated(df), ]
team position points
2 AG 5
8 BF 10
예시 3: 각 고유 행의 중복 횟수 계산
다음 코드는 데이터 프레임의 각 고유 행에 대한 중복 수를 계산하는 방법을 보여줍니다.
library (dplyr)
#count number of duplicate rows in data frame
df %>% group_by_all() %>% count
# A tibble: 6 x 4
# Groups: team, position, points [6]
team position points n
1 AF 10 1
2 AG 5 2
3 GA 8 1
4 BF 10 2
5 BG 5 1
6 BG 7 1
n 열에는 각 고유 행의 중복 수가 표시됩니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
dplyr을 사용하여 중복 요소를 찾는 방법
R에서 중복 줄을 제거하는 방법
R에서 중복된 줄을 제거하여 남은 줄이 없도록 하는 방법