R에서 내부 조인을 수행하는 방법(예제 포함)
R에서 내부 조인을 수행하는 두 가지 일반적인 방법이 있습니다.
방법 1: 기본 R 사용
merge(df1, df2, by=' column_to_join_on ')
방법 2: dplyr 사용
library (dplyr) inner_join(df1, df2, by=' column_to_join_on ')
두 방법 모두 동일한 결과를 생성하지만 dplyr 방법은 매우 큰 데이터 세트에서 더 빠르게 수행되는 경향이 있습니다.
다음 예에서는 다음 데이터 프레임에서 이러한 각 기능을 실제로 사용하는 방법을 보여줍니다.
#define first data frame df1 = data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'), points=c(18, 22, 19, 14, 14, 11, 20, 28)) df1 team points 1 to 18 2 B 22 3 C 19 4 D 14 5 E 14 6 F 11 7 G 20 8:28 a.m. #define second data frame df2 = data. frame (team=c('A', 'B', 'C', 'D', 'G', 'H'), assists=c(4, 9, 14, 13, 10, 8)) df2 team assists 1 to 4 2 B 9 3 C 14 4 D 13 5G 10 6:8 a.m.
예 1: Base R을 사용한 내부 조인
기본 R의 merge() 함수를 사용하여 ‘team’ 열을 조인할 열로 사용하여 내부 조인을 수행할 수 있습니다.
#perform inner join using base R df3 <- merge(df1, df2, by=' team ') #view result df3 team points assists 1 to 18 4 2 B 22 9 3 C 19 14 4 D 14 13 5 G 20 10 6:28 a.m. 8
두 데이터 세트 모두에 나타난 팀만 최종 데이터 세트에 유지됩니다.
예 2: dplyr을 사용한 내부 조인
dplyr 패키지의 inner_join() 함수를 사용하여 ‘team’ 열을 조인할 열로 사용하여 내부 조인을 수행할 수 있습니다.
library (dplyr) #perform inner join using dplyr df3 <- inner_join(df1, df2, by=' team ') #view result df3 team points assists 1 to 18 4 2 B 22 9 3 C 19 14 4 D 14 13 5 G 20 10 6:28 a.m. 8
이는 기본 R의 merge() 함수를 사용하여 얻은 결과에 해당합니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 왼쪽 조인을 수행하는 방법
R에서 올바른 조인을 수행하는 방법
R의 데이터 프레임에 열을 추가하는 방법
R의 데이터 프레임에서 열을 제거하는 방법