Dplyr에서 coalesce() 함수를 사용하는 방법(예제 포함)


R의 dplyr 패키지에 있는 coalesce() 함수를 사용하여 하나 이상의 벡터의 각 위치에서 누락되지 않은 첫 번째 값을 반환할 수 있습니다.

이 기능을 사용하는 두 가지 일반적인 방법이 있습니다.

방법 1: 벡터의 누락된 값 대체

 library (dplyr)

#replace missing values with 100
coalescence(x, 100)

방법 2: 데이터 프레임 열에서 누락되지 않은 첫 번째 값을 반환합니다.

 library (dplyr)

#return first non-missing value at each position across columns A and B
coalesce(df$A, df$B)

다음 예에서는 각 방법을 실제로 적용하는 방법을 보여줍니다.

예시 1: coalesce()를 사용하여 벡터의 누락된 값 대체

다음 코드는 coalesce() 함수를 사용하여 벡터의 모든 누락된 값을 값 100으로 바꾸는 방법을 보여줍니다.

 library (dplyr)

#create vector of values
x <- c(4, NA, 12, NA, 5, 14, 19)

#replace missing values with 100
coalescence(x, 100)

[1] 4 100 12 100 5 14 19

원본 벡터의 각 NA 값은 100 값으로 대체되었습니다.

예제 2: coalesce()를 사용하여 데이터 프레임 열에서 누락되지 않은 첫 번째 값 반환

R에 다음과 같은 데이터 프레임이 있다고 가정합니다.

 #create data frame
df <- data. frame (A=c(10, NA, 5, 6, NA, 7, NA),
                 B=c(14, 9, NA, 3, NA, 10, 4))

#view data frame
df

   AB
1 10 14
2 NA 9
3 5 NA
4 6 3
5 NA NA
6 7 10
7 NA 4

다음 코드는 coalesce() 함수를 사용하여 데이터 프레임의 A 열과 B 열에 누락되지 않은 첫 번째 값을 반환하는 방법을 보여줍니다.

 library (dplyr)

#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B)

#view updated data frame
df

   ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA NA
6 7 10 7
7 NA 4 4

결과 열 C에는 열 A와 B의 누락되지 않은 첫 번째 값이 포함됩니다.

A열과 B열 모두 이 행에 NA 값이 있으므로 5행의 C열에는 NA 값이 있습니다.

각 열에 NA 값이 있는 경우 coalesce() 함수에 추가 값을 추가하여 값으로 사용할 수 있습니다.

 library (dplyr)

#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B, 100)

#view updated data frame
df

   ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA 100
6 7 10 7
7 NA 4 4

이제 C열 5행의 NA 값이 100 값으로 대체되었습니다.

추가 리소스

다음 튜토리얼에서는 dplyr을 사용하여 다른 일반적인 기능을 수행하는 방법을 설명합니다.

dplyr을 사용하여 행을 삭제하는 방법
dplyr을 사용하여 행을 정렬하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다