A: so führen sie datenrahmen basierend auf mehreren spalten zusammen
Sie können die folgende grundlegende Syntax verwenden, um zwei Datenrahmen in R basierend auf mehreren Spalten zusammenzuführen:
merge(df1, df2, by. x =c(' col1 ', ' col2 '), by. y =c(' col1 ', ' col2 '))
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Datenblöcke über mehrere Spalten hinweg zusammenführen
Angenommen, wir haben die folgenden zwei Datenrahmen in R:
#define data frames
df1 = data. frame (playerID=c(1, 2, 3, 4, 5, 6),
team=c('A', 'B', 'B', 'B', 'C', 'C'),
dots=c(19, 22, 25, 29, 34, 39))
df2 = data. frame (playerID=c(1, 2, 3, 4),
tm=c('A', 'B', 'B', 'B'),
rebounds=c(7, 8, 8, 14))
#view first data frame
df1
playerID team points
1 1 A 19
2 2 B 22
3 3 B 25
4 4 B 29
5 5 C 34
6 6 C 39
#view second data frame
df2
playerID tm rebounds
1 1 To 7
2 2 B 8
3 3 B 8
4 4 B 14
Beachten Sie, dass beide Datenrahmen die Spalte „playerID“ gemeinsam nutzen, die Teamspalten jedoch in jedem Datenrahmen unterschiedliche Namen haben:
- Der erste Datenrahmen enthält die Spalte „ Team “.
- Der zweite Datenrahmen hat die Spalte „ tm “
Um diese Datenrahmen basierend auf den Spalten „playerID“ und „team“ zusammenzuführen, müssen wir die Argumente „by.x “ und „ by.y“ verwenden.
Wir können den folgenden Code verwenden, um diese Zusammenführung durchzuführen:
#merge two data frames merged = merge(df1, df2, by. x =c(' playerID ', ' team '), by. y =c(' playerID ', ' tm ')) #view merged data frame merged playerID team points rebounds 1 1 A 19 7 2 2 B 22 8 3 3 B 25 8 4 4 B 29 14
Der endgültige zusammengeführte Datenrahmen enthält Daten für alle vier Spieler, die zu den ursprünglichen beiden Datenrahmen gehören.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere gängige Datenrahmenfunktionen in R ausführen:
So führen Sie eine Linksverknüpfung in R durch
So führen Sie einen VLOOKUP in R durch
So fügen Sie Zeilen zum Datenrahmen in R hinzu