R에서 외부 조인을 수행하는 방법(예제 포함)
R에서 외부 조인을 수행하는 두 가지 일반적인 방법이 있습니다.
방법 1: 기본 R 사용
merge(df1, df2, by=' column_to_join_on ', all= TRUE )
방법 2: dplyr 사용
library (dplyr) full_join(df1, df2, by=' column_to_join_on ')
각 방법은 두 테이블의 모든 행을 반환합니다.
두 방법 모두 동일한 결과를 생성하지만 dplyr 방법은 매우 큰 데이터 세트에서 더 빠르게 수행되는 경향이 있습니다.
다음 예에서는 다음 데이터 프레임에서 이러한 각 기능을 실제로 사용하는 방법을 보여줍니다.
#define first data frame df1 = data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'), points=c(18, 22, 19, 14, 14, 11, 20, 28)) df1 team points 1 to 18 2 B 22 3 C 19 4 D 14 5 E 14 6 F 11 7 G 20 8:28 a.m. #define second data frame df2 = data. frame (team=c('A', 'B', 'C', 'D', 'L', 'M'), assists=c(4, 9, 14, 13, 10, 8)) df2 team assists 1 to 4 2 B 9 3 C 14 4 D 13 5 L 10 6 M 8
예 1: Base R을 사용한 외부 조인
기본 R의 merge() 함수를 사용하여 ‘team’ 열을 조인할 열로 사용하여 외부 조인을 수행할 수 있습니다.
#perform outer join using base R df3 <- merge(df1, df2, by=' team ', all= TRUE ) #view result df3 team points assists 1 to 18 4 2 B 22 9 3 C 19 14 4 D 14 13 5 E 14 NA 6 F 11 NA 7 G 20 NA 8:28 AM NA 9L NA 10 10M NA 8
두 데이터 프레임의 모든 행이 반환됩니다.
예 2: dplyr을 사용한 외부 조인
dplyr 패키지의 full_join() 함수를 사용하여 ‘team’ 열을 조인할 열로 사용하여 외부 조인을 수행할 수 있습니다.
library (dplyr) #perform outer join using dplyr df3 <- full_join(df1, df2, by=' team ') #view result df3 team points assists 1 to 18 4 2 B 22 9 3 C 19 14 4 D 14 13 5 E 14 NA 6 F 11 NA 7 G 20 NA 8:28 AM NA 9L NA 10 10M NA 8
이는 기본 R의 merge() 함수를 사용하여 얻은 결과에 해당합니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.