So erstellen sie einen left join in r (mit beispielen)
Sie können die Funktion merge() verwenden, um einen Left-Join in Basis R durchzuführen:
#left join using base R merge(df1,df2, all. x = TRUE )
Sie können auch die Funktion left_join() aus dem dplyr- Paket verwenden, um einen Left-Join durchzuführen:
#left join using dplyr
dplyr::left_join(df2, df1)
Hinweis: Wenn Sie mit extrem großen Datensätzen arbeiten, ist die Funktion left_join() tendenziell schneller als die Funktion merge() .
Die folgenden Beispiele zeigen, wie jede dieser Funktionen in der Praxis mit den folgenden Datenrahmen verwendet wird:
#define first data frame df1 <- data. frame (team=c(' Mavs ', ' Hawks ', ' Spurs ', ' Nets '), dots=c(99, 93, 96, 104)) df1 team points 1 Mavs 99 2 Hawks 93 3 Spurs 96 4 Nets 104 #define second data frame df2 <- data. frame (team=c(' Mavs ', ' Hawks ', ' Spurs ', ' Nets '), rebounds=c(25, 32, 38, 30), assists=c(19, 18, 22, 25)) df2 team rebound assists 1 Mavs 25 19 2 Hawks 32 18 3 Spurs 38 22 4 Nets 30 25
Beispiel 1: Linker Join mit Basis R
Wir können die Funktion merge() in Basis-R verwenden, um einen Links-Join durchzuführen, wobei wir die Spalte „Team“ als Spalte für den Join verwenden:
#perform left join using base R merge(df1, df2, by=' team ', all. x = TRUE ) team points rebound assists 1 Hawks 93 32 18 2 Mavs 99 25 19 3 Nets 104 30 25 4 Spurs 96 38 22
Beispiel 2: Linker Join mit dplyr
Wir können die Funktion left_join() aus dem dplyr-Paket verwenden, um einen Left-Join durchzuführen, wobei wir die Spalte „team“ als Spalte für den Join verwenden:
library (dplyr) #perform left join using dplyr left_join(df1, df2, by=' team ') team points rebound assists 1 Mavs 99 25 19 2 Hawks 93 32 18 3 Spurs 96 38 22 4 Nets 104 30 25
Ein Unterschied, den Sie zwischen diesen beiden Funktionen bemerken werden, besteht darin, dass die Funktion merge() die Zeilen automatisch alphabetisch sortiert, basierend auf der Spalte, die Sie zum Durchführen der Verknüpfung verwendet haben.
Umgekehrt behält die Funktion left_join() die ursprüngliche Reihenfolge der Zeilen im ersten Datenrahmen bei.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in R ausgeführt werden:
So führen Sie einen Inner Join in R durch
So führen Sie Fuzzy-Matching in R durch
So fügen Sie in R eine Spalte zum Datenrahmen hinzu
So entfernen Sie Spalten aus dem Datenrahmen in R