So führen sie eine linksverknüpfung mit ausgewählten spalten in dplyr durch


Sie können die folgende grundlegende Syntax in dplyr verwenden, um eine Linksverknüpfung für zwei Datenrahmen durchzuführen, indem Sie nur die ausgewählten Spalten verwenden:

 library (dplyr)

final_df <- df_A %>% 
  left_join(select(df_B, team, conference), by=" team ")

In diesem speziellen Beispiel wird eine Linksverknüpfung für Datenrahmen namens df_A und df_B durchgeführt und mit der Spalte namens team verknüpft, aber nur die Team- und Konferenzspalten von df_B werden in den resultierenden Datenrahmen einbezogen.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Führen Sie einen Left-Join mit ausgewählten Spalten in dplyr durch

Angenommen, wir haben die folgenden zwei Datenrahmen in R:

 #create first data frame
df_A <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                   dots=c(22, 25, 19, 14, 38))

df_A

  team points
1 to 22
2 B 25
3 C 19
4 D 14
5 E 38

#create second data frame
df_B <- data. frame (team=c('A', 'C', 'D', 'F', 'G'),
                   conference=c('W', 'W', 'E', 'E', 'E'),
                   rebounds=c(14, 8, 8, 6, 9),
                   assists=c(4, 3, 9, 9, 4))

df_B

  team conference rebounds assists
1 AW 14 4
2 CW 8 3
3 OF 8 9
4 FE 6 9
5 GE 9 4

Wir können die folgende Syntax in dplyr verwenden, um einen Left-Join durchzuführen, aber nur die Team- und Konferenzspalten von df_B einzubinden:

 library (dplyr)

#perform left join but only bring in team and conference columns from df_B
final_df <- df_A %>% 
  left_join(select(df_B, team, conference), by=" team ")

#view final data frame
final_df

  team points conference
1A 22W
2 B 25 NA
3C 19W
4 D 14 E
5 E 38 NA

Der resultierende Datenrahmen enthält alle Zeilen von df_A und nur Zeilen von df_B , in denen die Teamwerte übereinstimmen.

Mit der Funktion select() von dplyr konnten wir festlegen, dass wir nur die Team- und Konferenzspalten aus df_B importieren wollten.

Beachten Sie, dass die Bounces- und Assist -Spalten von df_B nicht im endgültigen Datenrahmen enthalten waren.

Hinweis : Die vollständige Dokumentation der Funktion left_join() in dplyr finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in R ausgeführt werden:

So führen Sie eine Linksverknüpfung in R durch
So führen Sie einen Right Join in R durch
So führen Sie einen Inner Join in R durch
So führen Sie einen Outer-Join in R durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert