A: so führen sie datenrahmen basierend auf mehreren spalten zusammen


Sie können die folgende grundlegende Syntax verwenden, um zwei Datenrahmen in R basierend auf mehreren Spalten zusammenzuführen:

 merge(df1, df2, by. x =c(' col1 ', ' col2 '), by. y =c(' col1 ', ' col2 '))

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Datenblöcke über mehrere Spalten hinweg zusammenführen

Angenommen, wir haben die folgenden zwei Datenrahmen in R:

 #define data frames
df1 = data. frame (playerID=c(1, 2, 3, 4, 5, 6),
                 team=c('A', 'B', 'B', 'B', 'C', 'C'),
                 dots=c(19, 22, 25, 29, 34, 39))

df2 = data. frame (playerID=c(1, 2, 3, 4),
                 tm=c('A', 'B', 'B', 'B'),
                 rebounds=c(7, 8, 8, 14))

#view first data frame
df1

  playerID team points
1 1 A 19
2 2 B 22
3 3 B 25
4 4 B 29
5 5 C 34
6 6 C 39

#view second data frame
df2 

  playerID tm rebounds
1 1 To 7
2 2 B 8
3 3 B 8
4 4 B 14

Beachten Sie, dass beide Datenrahmen die Spalte „playerID“ gemeinsam nutzen, die Teamspalten jedoch in jedem Datenrahmen unterschiedliche Namen haben:

  • Der erste Datenrahmen enthält die Spalte „ Team “.
  • Der zweite Datenrahmen hat die Spalte „ tm

Um diese Datenrahmen basierend auf den Spalten „playerID“ und „team“ zusammenzuführen, müssen wir die Argumente „by.x “ und „ by.y“ verwenden.

Wir können den folgenden Code verwenden, um diese Zusammenführung durchzuführen:

 #merge two data frames
merged = merge(df1, df2, by. x =c(' playerID ', ' team '), by. y =c(' playerID ', ' tm '))

#view merged data frame
merged

  playerID team points rebounds
1 1 A 19 7
2 2 B 22 8
3 3 B 25 8
4 4 B 29 14

Der endgültige zusammengeführte Datenrahmen enthält Daten für alle vier Spieler, die zu den ursprünglichen beiden Datenrahmen gehören.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere gängige Datenrahmenfunktionen in R ausführen:

So führen Sie eine Linksverknüpfung in R durch
So führen Sie einen VLOOKUP in R durch
So fügen Sie Zeilen zum Datenrahmen in R hinzu

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert