Come combinare due frame di dati in r con colonne diverse
Puoi utilizzare la funzione bind_rows() dal pacchetto dplyr in R per combinare rapidamente due frame di dati con colonne diverse:
library (dplyr)
bind_rows(df1, df2)
L’esempio seguente mostra come utilizzare questa funzione nella pratica.
Esempio: combina due frame di dati con colonne diverse
Supponiamo di avere i seguenti due frame di dati in R:
#define first data frame
df1 <- data. frame (A=c(1, 6, 3, 7, 5),
B=c(7, 9, 8, 3, 2),
C=c(3, 5, 2, 9, 9))
df1
ABC
1 1 7 3
2 6 9 5
3 3 8 2
4 7 3 9
5 5 2 9
#define second data frame
df2 <- data. frame (B=c(1, 3, 3, 4, 5),
C=c(7, 7, 8, 3, 2),
D=c(3, 3, 6, 6, 8))
df2
BCD
1 1 7 3
2 3 7 3
3 3 8 6
4 4 3 6
5 5 2 8
Tieni presente che df1 ha i seguenti nomi di colonna:
- HA
- B
- VS
E nota che df2 ha i seguenti nomi di colonna:
- B
- VS
- D
I nomi delle colonne non corrispondono, quindi la funzione rbind() in R genererà un errore se proviamo a usarla.
#attempt to use rbind to row bind data frames
rbind(df1, df2)
Error in match.names(clabs, names(xi)):
names do not match previous names
Invece, possiamo usare la funzione bind_rows() del pacchetto dplyr per combinare questi due frame di dati e riempire semplicemente i valori mancanti nel frame di dati risultante con valori NA:
library (dplyr)
#combine df1 and df2
bind_rows(df1, df2)
ABCD
1 1 7 3 NA
2 6 9 5 NA
3 3 8 2 NA
4 7 3 9 NA
5 5 2 9 NA
6 NA 1 7 3
7 NA 3 7 3
8 NA 3 8 6
9 NA 4 3 6
10 NA 5 2 8
Risorse addizionali
Come combinare due colonne in una in R
Come impilare le colonne del frame di dati in R