So kombinieren sie zwei datenrahmen in r mit unterschiedlichen spalten


Sie können die Funktion bind_rows() aus dem dplyr- Paket in R verwenden, um schnell zwei Datenrahmen mit unterschiedlichen Spalten zu kombinieren:

 library (dplyr)

bind_rows(df1, df2)

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: Kombinieren Sie zwei Datenrahmen mit unterschiedlichen Spalten

Angenommen, wir haben die folgenden zwei Datenrahmen in R:

 #define first data frame
df1 <- data. frame (A=c(1, 6, 3, 7, 5),
                  B=c(7, 9, 8, 3, 2),
                  C=c(3, 5, 2, 9, 9))

df1

  ABC
1 1 7 3
2 6 9 5
3 3 8 2
4 7 3 9
5 5 2 9

#define second data frame
df2 <- data. frame (B=c(1, 3, 3, 4, 5),
                  C=c(7, 7, 8, 3, 2),
                  D=c(3, 3, 6, 6, 8))

df2

  BCD
1 1 7 3
2 3 7 3
3 3 8 6
4 4 3 6
5 5 2 8

Beachten Sie, dass df1 die folgenden Spaltennamen hat:

  • HAT
  • B
  • VS

Und beachten Sie, dass df2 die folgenden Spaltennamen hat:

  • B
  • VS
  • D

Die Spaltennamen stimmen nicht überein, sodass die Funktion rbind() in R einen Fehler auslöst, wenn wir versuchen, sie zu verwenden.

 #attempt to use rbind to row bind data frames
rbind(df1, df2)

Error in match.names(clabs, names(xi)): 
  names do not match previous names

Stattdessen können wir die Funktion bind_rows() aus dem dplyr-Paket verwenden, um diese beiden Datenrahmen zu kombinieren und die fehlenden Werte im resultierenden Datenrahmen einfach mit NA-Werten zu füllen:

 library (dplyr)

#combine df1 and df2
bind_rows(df1, df2)

    ABCD
1 1 7 3 NA
2 6 9 5 NA
3 3 8 2 NA
4 7 3 9 NA
5 5 2 9 NA
6 NA 1 7 3
7 NA 3 7 3
8 NA 3 8 6
9 NA 4 3 6
10 NA 5 2 8

Zusätzliche Ressourcen

So kombinieren Sie in R zwei Spalten zu einer
So stapeln Sie Datenrahmenspalten in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert