Hoe u een left join uitvoert met behulp van geselecteerde kolommen in dplyr


U kunt de volgende basissyntaxis in dplyr gebruiken om een left join uit te voeren op twee dataframes met alleen de geselecteerde kolommen:

 library (dplyr)

final_df <- df_A %>% 
  left_join(select(df_B, team, conference), by=" team ")

In dit specifieke voorbeeld wordt een left join uitgevoerd op dataframes met de namen df_A en df_B , en wordt deze samengevoegd met de kolom genaamd team , maar alleen de team- en conferentiekolommen van df_B worden opgenomen in het resulterende dataframe.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Voer een left join uit met geselecteerde kolommen in dplyr

Stel dat we de volgende twee dataframes in R hebben:

 #create first data frame
df_A <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                   dots=c(22, 25, 19, 14, 38))

df_A

  team points
1 to 22
2 B 25
3 C 19
4 D 14
5 E 38

#create second data frame
df_B <- data. frame (team=c('A', 'C', 'D', 'F', 'G'),
                   conference=c('W', 'W', 'E', 'E', 'E'),
                   rebounds=c(14, 8, 8, 6, 9),
                   assists=c(4, 3, 9, 9, 4))

df_B

  team conference rebounds assists
1 AW 14 4
2 CW 8 3
3 OF 8 9
4 FE 6 9
5 GE 9 4

We kunnen de volgende syntaxis in dplyr gebruiken om een left join uit te voeren, maar alleen de team- en conferentiekolommen van df_B binnen te halen:

 library (dplyr)

#perform left join but only bring in team and conference columns from df_B
final_df <- df_A %>% 
  left_join(select(df_B, team, conference), by=" team ")

#view final data frame
final_df

  team points conference
1A 22W
2 B 25 NA
3C 19W
4 D 14 E
5 E 38 NA

Het resulterende dataframe bevat alle rijen uit df_A en alleen rijen uit df_B waar de teamwaarden overeenkomen.

Met behulp van de select()- functie van dplyr konden we specificeren dat we alleen de team- en conferentiekolommen uit df_B wilden importeren.

Houd er rekening mee dat de bounce- en hulpkolommen van df_B niet zijn opgenomen in het uiteindelijke gegevensframe.

Opmerking : u kunt de volledige documentatie van de functie left_join() in dplyr hier vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in R kunt uitvoeren:

Hoe maak je een linkse join in R
Hoe maak je een juiste join in R
Hoe maak je een inner join in R
Hoe u een buitenste join maakt in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert