A: 여러 열에서 고유한 행을 찾는 방법


다음 방법을 사용하여 R에서 데이터 프레임의 여러 열에서 고유한 행을 찾을 수 있습니다.

방법 1: 여러 열에서 고유한 행 찾기(다른 열 제거)

 df_unique <- unique(df[c(' col1 ', ' col2 ')])

방법 2: 여러 열에서 고유한 행 찾기(다른 열 유지)

 df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]

다음 예에서는 다음 데이터 프레임에서 이러한 각 방법을 실제로 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
                 pos=c('G', 'G', 'F', 'G', 'F', 'F'),
                 dots=c(33, 28, 31, 39, 34, 40))

#view data frame
df

  conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40

방법 1: 여러 열에서 고유한 행 찾기(다른 열 제거)

다음 코드는 데이터 프레임의 confpos 열에서 고유한 행을 찾는 방법을 보여줍니다.

 #find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])

#view results
df_unique 

  conf pos
1 East G
3 East
4 West G
5 West

결과는 4개의 고유한 라인입니다.

또한 점수 열이 결과에서 자동으로 제거되었습니다.

방법 2: 여러 열에서 단일 행 찾기(다른 열 제거)

다음 코드는 데이터 프레임의 confpos 열에서 단일 행을 찾고 포인트 열의 값을 유지하는 방법을 보여줍니다.

 #find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]

#view results
df_unique 

  conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34

confpos 열에는 단일 행만 존재하며 points 열의 값은 유지됩니다.

처음 발생한 고유한 값만 유지된다는 점에 유의하는 것이 중요합니다.

예를 들어 처음 두 열에 “East”와 “G”가 포함된 두 행이 있었지만 이 고유한 조합이 처음 발생한 경우의 포인트 값(33)만 최종 데이터 프레임에 유지되었습니다.

마찬가지로 처음 두 열에는 “West”와 “F”가 포함된 두 행이 있었지만 이 고유한 조합이 처음 발생한 경우의 포인트 값(34)만 최종 데이터 프레임에 유지되었습니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R의 열에서 고유한 값을 찾는 방법
R에서 그룹별로 고유한 값을 계산하는 방법
dplyr을 사용하여 고유 값을 필터링하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다