Como fazer uma junção interna em r (com exemplos)
Existem duas maneiras comuns de realizar uma junção interna em R:
Método 1: Use Base R
merge(df1, df2, by=' column_to_join_on ')
Método 2: use dplyr
library (dplyr) inner_join(df1, df2, by=' column_to_join_on ')
Ambos os métodos produzirão o mesmo resultado, mas o método dplyr tenderá a ter um desempenho mais rápido em conjuntos de dados extremamente grandes.
Os exemplos a seguir mostram como usar cada uma dessas funções na prática com os seguintes quadros de dados:
#define first data frame df1 = data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'), points=c(18, 22, 19, 14, 14, 11, 20, 28)) df1 team points 1 to 18 2 B 22 3 C 19 4 D 14 5 E 14 6 F 11 7 G 20 8:28 a.m. #define second data frame df2 = data. frame (team=c('A', 'B', 'C', 'D', 'G', 'H'), assists=c(4, 9, 14, 13, 10, 8)) df2 team assists 1 to 4 2 B 9 3 C 14 4 D 13 5G 10 6:8 a.m.
Exemplo 1: Junção interna usando Base R
Podemos usar a função merge() na base R para realizar uma junção interna, usando a coluna ‘team’ como a coluna à qual ingressar:
#perform inner join using base R df3 <- merge(df1, df2, by=' team ') #view result df3 team points assists 1 to 18 4 2 B 22 9 3 C 19 14 4 D 14 13 5 G 20 10 6:28 a.m. 8
Observe que apenas as equipes que apareceram em ambos os conjuntos de dados são retidas no conjunto de dados final.
Exemplo 2: junção interna usando dplyr
Podemos usar a função inner_join() do pacote dplyr para realizar uma junção interna, usando a coluna ‘team’ como a coluna para ingressar:
library (dplyr) #perform inner join using dplyr df3 <- inner_join(df1, df2, by=' team ') #view result df3 team points assists 1 to 18 4 2 B 22 9 3 C 19 14 4 D 14 13 5 G 20 10 6:28 a.m. 8
Observe que isso corresponde ao resultado que obtivemos usando a função merge() na base R.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em R:
Como fazer uma junção à esquerda no R
Como fazer uma junção correta em R
Como adicionar coluna ao quadro de dados em R
Como remover colunas do quadro de dados em R