Comment réparer dans R : erreur dans rbind(deparse.level, …) : les nombres de colonnes d’arguments ne correspondent pas
Une erreur que vous pouvez rencontrer dans R est :
Error in rbind(deparse.level, ...) : numbers of columns of arguments do not match
Cette erreur se produit lorsque vous tentez d’utiliser la fonction rbind() dans R pour lier ensemble deux trames de données ou plus qui n’ont pas le même nombre de colonnes.
Ce didacticiel explique exactement comment corriger cette erreur.
Comment reproduire l’erreur
Supposons que nous ayons les deux trames de données suivantes dans R :
#create first data frame
df1 <- data.frame(x=c(1, 4, 4, 5, 3),
y=c(4, 4, 2, 8, 10))
df1
x y
1 1 4
2 4 4
3 4 2
4 5 8
5 3 10
#create second data frame
df2 <- data.frame(x=c(2, 2, 2, 5, 7),
y=c(3, 6, 2, 0, 0),
z=c(2, 7, 7, 8, 15))
df2
x y z
1 2 3 2
2 2 6 7
3 2 2 7
4 5 0 8
5 7 0 15
Supposons maintenant que nous essayions d’utiliser rbind pour lier ces deux trames de données en une seule trame de données :
#attempt to row-bind the two data frames together
rbind(df1, df2)
Error in rbind(deparse.level, ...) :
numbers of columns of arguments do not match
Nous recevons une erreur car les deux trames de données n’ont pas le même nombre de colonnes.
Comment réparer l’erreur
Il existe deux manières de résoudre ce problème :
Méthode 1 : utiliser rbind sur les colonnes communes
Une façon de résoudre ce problème consiste à utiliser la fonction intersect() pour rechercher les noms de colonnes communs entre les blocs de données, puis à lier les blocs de données uniquement sur ces colonnes :
#find common column names
common <- intersect(colnames(df1), colnames(df2))
#row-bind only on common column names
df3 <- rbind(df1[common], df2[common])
#view result
df3
x y
1 1 4
2 4 4
3 4 2
4 5 8
5 3 10
6 2 3
7 2 6
8 2 2
9 5 0
10 7 0
Méthode 2 : utilisez bind_rows() depuis dplyr
Une autre façon de résoudre ce problème consiste à utiliser la fonction bind_rows() du package dplyr , qui remplit automatiquement les valeurs NA pour les noms de colonnes qui ne correspondent pas :
library(dplyr)
#bind together the two data frames
df3 <- bind_rows(df1, df2)
#view result
df3
x y z
1 1 4 NA
2 4 4 NA
3 4 2 NA
4 5 8 NA
5 3 10 NA
6 2 3 2
7 2 6 7
8 2 2 7
9 5 0 8
10 7 0 15
Notez que les valeurs NA sont renseignées pour les valeurs de df1 puisque la colonne z n’existait pas dans ce bloc de données.
Ressources additionnelles
Les didacticiels suivants expliquent comment résoudre d’autres erreurs courantes dans R :
Comment réparer dans R : les noms ne correspondent pas aux noms précédents
Comment réparer dans R : la longueur d’un objet plus longue n’est pas un multiple de la longueur d’un objet plus courte
Comment réparer dans R : les contrastes ne peuvent être appliqués qu’à des facteurs avec 2 niveaux ou plus