A: so führen sie datenrahmen nach spaltennamen zusammen

Von Dr. Benjamin Anderson Juli 19, 2023 Führung Keine Kommentare

Sie können die folgenden Methoden verwenden, um Datenrahmen nach Spaltennamen in R zusammenzuführen:

Methode 1: Zusammenführung basierend auf einem passenden Spaltennamen

 merge(df1, df2, by=' var1 ')

Methode 2: Zusammenführung basierend auf nicht übereinstimmendem Spaltennamen

 merge(df1, df2, by. x = ' var1 ', by. y = ' variable1 ')

Methode 3: Zusammenführung basierend auf mehreren übereinstimmenden Spaltennamen

 merge(df1, df2, by=c(' var1 ', ' var2 '))

Methode 4: Zusammenführung basierend auf mehreren nicht übereinstimmenden Spaltennamen

 merge(df1, df2, by. x =c(' var1 ', ' var2 '), by. y =c(' variable1 ', ' variable2 '))

Die folgenden Beispiele zeigen, wie die einzelnen Methoden in der Praxis angewendet werden.

Beispiel 1: Zusammenführung basierend auf übereinstimmendem Spaltennamen

Der folgende Code zeigt, wie zwei Datenrahmen in R basierend auf einem übereinstimmenden Spaltennamen zusammengeführt werden:

 #define data frames
df1 <- data. frame (team=c('A', 'B', 'C', 'D'),
                  dots=c(88, 98, 104, 100))

df2 <- data. frame (team=c('A', 'B', 'C', 'D'),
                  rebounds=c(22, 31, 29, 20))

#merge based on one column with matching name
merge(df1, df2, by=' team ')

  team points rebounds
1 A 88 22
2 B 98 31
3 C 104 29
4 D 100 20

Das Ergebnis ist ein Datenrahmen, der mithilfe der Teamspalte mit den Zeilen in jedem Datenrahmen übereinstimmt.

Beispiel 2: Zusammenführung basierend auf nicht übereinstimmendem Spaltennamen

Der folgende Code zeigt, wie zwei Datenrahmen in R basierend auf einem nicht übereinstimmenden Spaltennamen zusammengeführt werden:

 #define data frames
df1 <- data. frame (team=c('A', 'B', 'C', 'D'),
                  dots=c(88, 98, 104, 100))

df2 <- data. frame (team_name=c('A', 'B', 'C', 'D'),
                  rebounds=c(22, 31, 29, 20))

#merge based on one column with unmatched name
merge(df1, df2, by. x = ' team ', by. y = ' team_name ')

  team points rebounds
1 A 88 22
2 B 98 31
3 C 104 29
4 D 100 20

Das Ergebnis ist ein Datenrahmen, der Zeilen mithilfe der Spalte „team“ im ersten Datenrahmen und der Spalte „team_name“ im zweiten Datenrahmen abgleicht.

Beispiel 3: Zusammenführung basierend auf mehreren übereinstimmenden Spaltennamen

Der folgende Code zeigt, wie zwei Datenrahmen in R basierend auf mehreren übereinstimmenden Spaltennamen zusammengeführt werden:

 #define data frames
df1 <- data. frame (team=c('A', 'A', 'B', 'B'),
                  position=c('G', 'F', 'G', 'F'),
                  dots=c(88, 98, 104, 100))

df2 <- data. frame (team=c('A', 'A', 'B', 'B'),
                  position=c('G', 'F', 'G', 'F'),
                  rebounds=c(22, 31, 29, 20))

#merge based on multiple columns with matching names
merge(df1, df2, by=c(' team ', ' position '))

  team position points rebounds
1 AF 98 31
2 AG 88 22
3 BF 100 20
4 BG 104 29

Das Ergebnis ist ein Datenrahmen, der mithilfe der Team- und Positionsspalte in jedem Datenrahmen mit den Zeilen in jedem Datenrahmen übereinstimmt.

Beispiel 4: Zusammenführung basierend auf mehreren nicht übereinstimmenden Spaltennamen

Der folgende Code zeigt, wie zwei Datenrahmen in R basierend auf mehreren nicht übereinstimmenden Spaltennamen zusammengeführt werden:

 #define data frames
df1 <- data. frame (team=c('A', 'A', 'B', 'B'),
                  position=c('G', 'F', 'G', 'F'),
                  dots=c(88, 98, 104, 100))

df2 <- data. frame (team_name=c('A', 'A', 'B', 'B'),
                  position_name=c('G', 'F', 'G', 'F'),
                  rebounds=c(22, 31, 29, 20))

#merge based on multiple columns with matching names
merge(df1, df2, by. x =c(' team ', ' position '), by. y =c(' team_name ', ' position_name '))

  team position points rebounds
1 AF 98 31
2 AG 88 22
3 BF 100 20
4 BG 104 29

Das Ergebnis ist ein Datenrahmen, der Zeilen mithilfe der Team- und Positionsspalten im ersten Datenrahmen und der Spalten team_name und position_name im zweiten Datenrahmen abgleicht.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere gängige Datenrahmenfunktionen in R ausführen:

So führen Sie eine Linksverknüpfung in R durch
So führen Sie einen Inner Join in R durch
So führen Sie einen VLOOKUP in R durch
So fügen Sie Zeilen zum Datenrahmen in R hinzu

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen