R의 데이터 프레임에서 단일 행을 선택하는 방법


다음 방법을 사용하여 R의 데이터 프레임에서 단일 행을 선택할 수 있습니다.

방법 1: 모든 열에서 단일 행 선택

 library (dplyr)

df %>% distinct()

방법 2: 열을 기준으로 단일 행 선택

 library (dplyr)

df %>% distinct(column1, . keep_all = TRUE )

방법 3: 여러 열을 기반으로 단일 행 선택

 library (dplyr)

df %>% distinct(column1, column2, . keep_all = TRUE )

이 튜토리얼에서는 다음 데이터 프레임을 사용하여 실제로 각 방법을 사용하는 방법을 설명합니다.

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(10, 10, 8, 14, 15, 15, 17, 17))

#view data frame
df

  team position points
1 AG 10
2 AG 10
3AF 8
4 AF 14
5 BG 15
6 BG 15
7 BF 17
8 BF 17

예 1: 모든 열에서 고유한 행 선택

다음 코드는 데이터 프레임의 모든 열에서 고유한 값을 가진 행을 선택하는 방법을 보여줍니다.

 library (dplyr)

#select rows with unique values across all columns
df %>% distinct()

  team position points
1 AG 10
2AF 8
3 AF 14
4 BG 15
5 BF 17

데이터 프레임에 5개의 고유한 행이 있는 것을 볼 수 있습니다.

참고 : 중복 행이 발견되면 첫 번째 고유 행만 유지됩니다.

예 2: 열을 기준으로 단일 행 선택

다음 코드는 열만을 기준으로 단일 행을 선택하는 방법을 보여줍니다.

 library (dplyr)

#select rows with unique values based on team column only
df %>% distinct(team, . keep_all = TRUE )

  team position points
1 AG 10
2 BG 15

Team 열에는 고유한 값이 2개만 있으므로 각 값이 처음 나타나는 행만 유지됩니다.

참고 : .keep_all=TRUE 인수는 R에게 출력의 다른 모든 열을 유지하도록 지시합니다.

예 3: 여러 열을 기반으로 단일 행 선택

다음 코드는 직책 열만을 기준으로 단일 행을 선택하는 방법을 보여줍니다.

 library (dplyr)

#select rows with unique values based on team and position columns only
df %>% distinct(team, position, . keep_all = TRUE )

  team position points
1 AG 10
2AF 8
3 BG 15
4 BF 17

TeamPosition 열에 4개의 고유한 값 조합이 있으므로 4개의 행이 반환됩니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

dplyr을 사용하여 고유 값을 필터링하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법
R의 열에서 발생 횟수를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다