Dplyr에서 coalesce() 함수를 사용하는 방법(예제 포함)

에 의해 벤자민 앤더슨 7월 17, 2023 가이드 댓글 0개

R의 dplyr 패키지에 있는 coalesce() 함수를 사용하여 하나 이상의 벡터의 각 위치에서 누락되지 않은 첫 번째 값을 반환할 수 있습니다.

이 기능을 사용하는 두 가지 일반적인 방법이 있습니다.

방법 1: 벡터의 누락된 값 대체

 library (dplyr)

#replace missing values with 100
coalescence(x, 100)

방법 2: 데이터 프레임 열에서 누락되지 않은 첫 번째 값을 반환합니다.

 library (dplyr)

#return first non-missing value at each position across columns A and B
coalesce(df$A, df$B)

다음 예에서는 각 방법을 실제로 적용하는 방법을 보여줍니다.

예시 1: coalesce()를 사용하여 벡터의 누락된 값 대체

다음 코드는 coalesce() 함수를 사용하여 벡터의 모든 누락된 값을 값 100으로 바꾸는 방법을 보여줍니다.

 library (dplyr)

#create vector of values
x <- c(4, NA, 12, NA, 5, 14, 19)

#replace missing values with 100
coalescence(x, 100)

[1] 4 100 12 100 5 14 19

원본 벡터의 각 NA 값은 100 값으로 대체되었습니다.

예제 2: coalesce()를 사용하여 데이터 프레임 열에서 누락되지 않은 첫 번째 값 반환

R에 다음과 같은 데이터 프레임이 있다고 가정합니다.

 #create data frame
df <- data. frame (A=c(10, NA, 5, 6, NA, 7, NA),
                 B=c(14, 9, NA, 3, NA, 10, 4))

#view data frame
df

   AB
1 10 14
2 NA 9
3 5 NA
4 6 3
5 NA NA
6 7 10
7 NA 4

다음 코드는 coalesce() 함수를 사용하여 데이터 프레임의 A 열과 B 열에 누락되지 않은 첫 번째 값을 반환하는 방법을 보여줍니다.

 library (dplyr)

#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B)

#view updated data frame
df

   ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA NA
6 7 10 7
7 NA 4 4

결과 열 C에는 열 A와 B의 누락되지 않은 첫 번째 값이 포함됩니다.

A열과 B열 모두 이 행에 NA 값이 있으므로 5행의 C열에는 NA 값이 있습니다.

각 열에 NA 값이 있는 경우 coalesce() 함수에 추가 값을 추가하여 값으로 사용할 수 있습니다.

 library (dplyr)

#create new column that coalesces values from columns A and B
df$C <- coalesce(df$A, df$B, 100)

#view updated data frame
df

   ABC
1 10 14 10
2 NA 9 9
3 5 NA 5
4 6 3 6
5 NA NA 100
6 7 10 7
7 NA 4 4

이제 C열 5행의 NA 값이 100 값으로 대체되었습니다.

추가 리소스

다음 튜토리얼에서는 dplyr을 사용하여 다른 일반적인 기능을 수행하는 방법을 설명합니다.

dplyr을 사용하여 행을 삭제하는 방법
dplyr을 사용하여 행을 정렬하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예시 1: coalesce()를 사용하여 벡터의 누락된 값 대체

예제 2: coalesce()를 사용하여 데이터 프레임 열에서 누락되지 않은 첫 번째 값 반환

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다