Dplyr을 사용하여 고유 값을 필터링하는 방법


dplyr 패키지를 사용하여 R의 데이터 프레임에서 고유 값을 필터링하려면 다음 방법을 사용할 수 있습니다.

방법 1: 열의 고유 값 필터링

 df %>% distinct(var1)

방법 2: 여러 열의 고유 값 필터링

 df %>% distinct(var1, var2)

방법 3: 모든 열의 고유 값 필터링

 df %>% distinct()

다음 예에서는 R의 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

예시 1: 열의 고유 값 필터링

다음 코드를 사용하여 열에서만 고유 값을 필터링할 수 있습니다.

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

열의 고유한 값만 반환됩니다.

예시 2: 여러 열의 고유 값 필터링

다음 코드를 사용하여 포인트 열의 고유 값을 필터링할 수 있습니다.

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

포인트 열의 고유한 값만 반환됩니다.

예시 3: 모든 열의 고유 값 필터링

다음 코드를 사용하여 데이터 프레임의 모든 열에서 고유 값을 필터링할 수 있습니다.

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

세 열 모두에서 고유한 값이 반환됩니다.

참고 : 여기에서 dplyr의 별도 기능에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 dplyr에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

dplyr을 사용하여 인덱스로 열을 선택하는 방법
dplyr을 사용하여 그룹별로 첫 번째 행을 선택하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법
dplyr을 사용하여 특정 문자열이 포함된 행을 필터링하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다