Jak wykonać połączenie wewnętrzne w r (z przykładami)


Istnieją dwa popularne sposoby wykonywania złączenia wewnętrznego w R:

Metoda 1: Użyj podstawy R

 merge(df1, df2, by=' column_to_join_on ')

Metoda 2: użyj dplyr

 library (dplyr)

inner_join(df1, df2, by=' column_to_join_on ')

Obie metody dadzą ten sam wynik, ale metoda dplyr będzie działać szybciej na bardzo dużych zbiorach danych.

Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą z tych funkcji z następującymi ramkami danych:

 #define first data frame
df1 = data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28))

df1

  team points
1 to 18
2 B 22
3 C 19
4 D 14
5 E 14
6 F 11
7 G 20
8:28 a.m.

#define second data frame
df2 = data. frame (team=c('A', 'B', 'C', 'D', 'G', 'H'),
                 assists=c(4, 9, 14, 13, 10, 8))

df2

  team assists
1 to 4
2 B 9
3 C 14
4 D 13
5G 10
6:8 a.m.

Przykład 1: Sprzężenie wewnętrzne przy użyciu Base R

Możemy użyć funkcji merge() w bazie R, aby wykonać złączenie wewnętrzne, używając kolumny „zespół” jako kolumny, do której należy się połączyć:

 #perform inner join using base R
df3 <- merge(df1, df2, by=' team ')

#view result
df3

  team points assists
1 to 18 4
2 B 22 9
3 C 19 14
4 D 14 13
5 G 20 10
6:28 a.m. 8

Należy pamiętać, że w ostatecznym zbiorze danych uwzględnione zostaną tylko zespoły, które pojawiły się w obu zbiorach danych.

Przykład 2: Łączenie wewnętrzne przy użyciu dplyr

Możemy użyć funkcji inside_join() z pakietu dplyr , aby wykonać złącze wewnętrzne, używając kolumny „team” jako kolumny, do której należy dołączyć:

 library (dplyr)

#perform inner join using dplyr 
df3 <- inner_join(df1, df2, by=' team ')

#view result
df3

  team points assists
1 to 18 4
2 B 22 9
3 C 19 14
4 D 14 13
5 G 20 10
6:28 a.m. 8

Zauważ, że odpowiada to wynikowi, który uzyskaliśmy za pomocą funkcji merge() w bazie R.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w języku R:

Jak wykonać lewe złączenie w R
Jak wykonać prawidłowe połączenie w R
Jak dodać kolumnę do ramki danych w R
Jak usunąć kolumny z ramki danych w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *