Comment réparer dans R : erreur dans rbind(deparse.level, …) : les nombres de colonnes d’arguments ne correspondent pas



Une erreur que vous pouvez rencontrer dans R est :

Error in rbind(deparse.level, ...) : 
  numbers of columns of arguments do not match 

Cette erreur se produit lorsque vous tentez d’utiliser la fonction rbind() dans R pour lier ensemble deux trames de données ou plus qui n’ont pas le même nombre de colonnes.

Ce didacticiel explique exactement comment corriger cette erreur.

Comment reproduire l’erreur

Supposons que nous ayons les deux trames de données suivantes dans R :

#create first data frame
df1 <- data.frame(x=c(1, 4, 4, 5, 3),
                  y=c(4, 4, 2, 8, 10))

df1

  x  y
1 1  4
2 4  4
3 4  2
4 5  8
5 3 10

#create second data frame 
df2 <- data.frame(x=c(2, 2, 2, 5, 7),
                  y=c(3, 6, 2, 0, 0),
                  z=c(2, 7, 7, 8, 15))

df2

  x y  z
1 2 3  2
2 2 6  7
3 2 2  7
4 5 0  8
5 7 0 15

Supposons maintenant que nous essayions d’utiliser rbind pour lier ces deux trames de données en une seule trame de données :

#attempt to row-bind the two data frames together
rbind(df1, df2)

Error in rbind(deparse.level, ...) : 
  numbers of columns of arguments do not match

Nous recevons une erreur car les deux trames de données n’ont pas le même nombre de colonnes.

Comment réparer l’erreur

Il existe deux manières de résoudre ce problème :

Méthode 1 : utiliser rbind sur les colonnes communes

Une façon de résoudre ce problème consiste à utiliser la fonction intersect() pour rechercher les noms de colonnes communs entre les blocs de données, puis à lier les blocs de données uniquement sur ces colonnes :

#find common column names
common <- intersect(colnames(df1), colnames(df2))

#row-bind only on common column names
df3 <- rbind(df1[common], df2[common])

#view result
df3

   x  y
1  1  4
2  4  4
3  4  2
4  5  8
5  3 10
6  2  3
7  2  6
8  2  2
9  5  0
10 7  0

Méthode 2 : utilisez bind_rows() depuis dplyr

Une autre façon de résoudre ce problème consiste à utiliser la fonction bind_rows() du package dplyr , qui remplit automatiquement les valeurs NA pour les noms de colonnes qui ne correspondent pas :

library(dplyr)

#bind together the two data frames
df3 <- bind_rows(df1, df2)

#view result
df3

   x  y  z
1  1  4 NA
2  4  4 NA
3  4  2 NA
4  5  8 NA
5  3 10 NA
6  2  3  2
7  2  6  7
8  2  2  7
9  5  0  8
10 7  0 15

Notez que les valeurs NA sont renseignées pour les valeurs de df1 puisque la colonne z n’existait pas dans ce bloc de données.

Ressources additionnelles

Les didacticiels suivants expliquent comment résoudre d’autres erreurs courantes dans R :

Comment réparer dans R : les noms ne correspondent pas aux noms précédents
Comment réparer dans R : la longueur d’un objet plus longue n’est pas un multiple de la longueur d’un objet plus courte
Comment réparer dans R : les contrastes ne peuvent être appliqués qu’à des facteurs avec 2 niveaux ou plus

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *