Een goede join maken in r (met voorbeelden)


Er zijn twee veelgebruikte manieren om een right join in R uit te voeren:

Methode 1: Gebruik Base R

 merge(df1, df2, by=' column_to_join_on ', all. y = TRUE )

Methode 2: gebruik dplyr

 library (dplyr)

right_join(df1, df2, by=' column_to_join_on ')

Beide methoden retourneren alle rijen uit df2 en alle rijen met overeenkomende sleutels uit df1 .

Het is ook de moeite waard om op te merken dat beide methoden hetzelfde resultaat zullen opleveren, maar dat de dplyr-methode doorgaans sneller presteert op extreem grote datasets.

De volgende voorbeelden laten zien hoe u elk van deze functies in de praktijk kunt gebruiken met de volgende dataframes:

 #define first data frame
df1 = data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28))

df1

  team points
1 to 18
2 B 22
3 C 19
4 D 14
5 E 14
6 F 11
7 G 20
8:28 a.m.

#define second data frame
df2 = data. frame (team=c('A', 'B', 'C', 'D', 'L', 'M'),
                 assists=c(4, 9, 14, 13, 10, 8))

df2

  team assists
1 to 4
2 B 9
3 C 14
4 D 13
5 L 10
6 M 8

Voorbeeld 1: Rechtse verbinding met Base R

We kunnen de functie merge() in basis R gebruiken om een right join uit te voeren, waarbij we de kolom ‚team‘ gebruiken als de kolom waaraan we moeten deelnemen:

 #perform right join using base R
df3 <- merge(df1, df2, by=' team ', all. y = TRUE )

#view result
df3

  team points assists
1 to 18 4
2 B 22 9
3 C 19 14
4 D 14 13
5 L NA 10
6 M NA 8

Merk op dat alle lijnen van df2 in het uiteindelijke dataframe waren opgenomen, maar dat alleen lijnen van df1 met een overeenkomende teamnaam in het uiteindelijke dataframe waren opgenomen.

Voorbeeld 2: Rechtse join met dplyr

We kunnen de functie right_join() uit het dplyr- pakket gebruiken om een right join uit te voeren, waarbij we de kolom ‚team‘ gebruiken als de kolom waaraan we moeten deelnemen:

 library (dplyr)

#perform right join using dplyr 
df3 <- right_join(df1, df2, by=' team ')

#view result
df3

  team points assists
1 to 18 4
2 B 22 9
3 C 19 14
4 D 14 13
5 L NA 10
6 M NA 8

Merk op dat dit overeenkomt met het resultaat dat we hebben verkregen met de functie merge() in basis R.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in R uitvoert:

Hoe maak je een linkse join in R
Hoe u een kolom aan een dataframe toevoegt in R
Kolommen verwijderen uit een dataframe in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert