A: so führen sie datenrahmen nach spaltennamen zusammen
Sie können die folgenden Methoden verwenden, um Datenrahmen nach Spaltennamen in R zusammenzuführen:
Methode 1: Zusammenführung basierend auf einem passenden Spaltennamen
merge(df1, df2, by=' var1 ')
Methode 2: Zusammenführung basierend auf nicht übereinstimmendem Spaltennamen
merge(df1, df2, by. x = ' var1 ', by. y = ' variable1 ')
Methode 3: Zusammenführung basierend auf mehreren übereinstimmenden Spaltennamen
merge(df1, df2, by=c(' var1 ', ' var2 '))
Methode 4: Zusammenführung basierend auf mehreren nicht übereinstimmenden Spaltennamen
merge(df1, df2, by. x =c(' var1 ', ' var2 '), by. y =c(' variable1 ', ' variable2 '))
Die folgenden Beispiele zeigen, wie die einzelnen Methoden in der Praxis angewendet werden.
Beispiel 1: Zusammenführung basierend auf übereinstimmendem Spaltennamen
Der folgende Code zeigt, wie zwei Datenrahmen in R basierend auf einem übereinstimmenden Spaltennamen zusammengeführt werden:
#define data frames
df1 <- data. frame (team=c('A', 'B', 'C', 'D'),
dots=c(88, 98, 104, 100))
df2 <- data. frame (team=c('A', 'B', 'C', 'D'),
rebounds=c(22, 31, 29, 20))
#merge based on one column with matching name
merge(df1, df2, by=' team ')
team points rebounds
1 A 88 22
2 B 98 31
3 C 104 29
4 D 100 20
Das Ergebnis ist ein Datenrahmen, der mithilfe der Teamspalte mit den Zeilen in jedem Datenrahmen übereinstimmt.
Beispiel 2: Zusammenführung basierend auf nicht übereinstimmendem Spaltennamen
Der folgende Code zeigt, wie zwei Datenrahmen in R basierend auf einem nicht übereinstimmenden Spaltennamen zusammengeführt werden:
#define data frames
df1 <- data. frame (team=c('A', 'B', 'C', 'D'),
dots=c(88, 98, 104, 100))
df2 <- data. frame (team_name=c('A', 'B', 'C', 'D'),
rebounds=c(22, 31, 29, 20))
#merge based on one column with unmatched name
merge(df1, df2, by. x = ' team ', by. y = ' team_name ')
team points rebounds
1 A 88 22
2 B 98 31
3 C 104 29
4 D 100 20
Das Ergebnis ist ein Datenrahmen, der Zeilen mithilfe der Spalte „team“ im ersten Datenrahmen und der Spalte „team_name“ im zweiten Datenrahmen abgleicht.
Beispiel 3: Zusammenführung basierend auf mehreren übereinstimmenden Spaltennamen
Der folgende Code zeigt, wie zwei Datenrahmen in R basierend auf mehreren übereinstimmenden Spaltennamen zusammengeführt werden:
#define data frames
df1 <- data. frame (team=c('A', 'A', 'B', 'B'),
position=c('G', 'F', 'G', 'F'),
dots=c(88, 98, 104, 100))
df2 <- data. frame (team=c('A', 'A', 'B', 'B'),
position=c('G', 'F', 'G', 'F'),
rebounds=c(22, 31, 29, 20))
#merge based on multiple columns with matching names
merge(df1, df2, by=c(' team ', ' position '))
team position points rebounds
1 AF 98 31
2 AG 88 22
3 BF 100 20
4 BG 104 29
Das Ergebnis ist ein Datenrahmen, der mithilfe der Team- und Positionsspalte in jedem Datenrahmen mit den Zeilen in jedem Datenrahmen übereinstimmt.
Beispiel 4: Zusammenführung basierend auf mehreren nicht übereinstimmenden Spaltennamen
Der folgende Code zeigt, wie zwei Datenrahmen in R basierend auf mehreren nicht übereinstimmenden Spaltennamen zusammengeführt werden:
#define data frames
df1 <- data. frame (team=c('A', 'A', 'B', 'B'),
position=c('G', 'F', 'G', 'F'),
dots=c(88, 98, 104, 100))
df2 <- data. frame (team_name=c('A', 'A', 'B', 'B'),
position_name=c('G', 'F', 'G', 'F'),
rebounds=c(22, 31, 29, 20))
#merge based on multiple columns with matching names
merge(df1, df2, by. x =c(' team ', ' position '), by. y =c(' team_name ', ' position_name '))
team position points rebounds
1 AF 98 31
2 AG 88 22
3 BF 100 20
4 BG 104 29
Das Ergebnis ist ein Datenrahmen, der Zeilen mithilfe der Team- und Positionsspalten im ersten Datenrahmen und der Spalten team_name und position_name im zweiten Datenrahmen abgleicht.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere gängige Datenrahmenfunktionen in R ausführen:
So führen Sie eine Linksverknüpfung in R durch
So führen Sie einen Inner Join in R durch
So führen Sie einen VLOOKUP in R durch
So fügen Sie Zeilen zum Datenrahmen in R hinzu