Comment réparer dans R : plus de colonnes que de noms de colonnes



Une erreur que vous pouvez rencontrer dans R est :

Error in read.table("my_data.csv", header=TRUE) : 
  more columns than column names 

Cette erreur se produit généralement lorsque vous tentez de lire un fichier CSV dans R à l’aide de la fonction read.table() et que vous ne parvenez pas à spécifier que le séparateur ( sep ) doit être une virgule.

Ce didacticiel explique exactement comment corriger cette erreur.

Comment reproduire l’erreur

Supposons que nous ayons le fichier CSV suivant appelé basketball_data.csv :

Supposons maintenant que nous essayions d’importer ce fichier dans R en utilisant la fonction read.table() :

#attempt to import CSV into data frame
df <- read.table("basketball_data.csv", header=TRUE) 

Error in read.table("basketball_data.csv", header = TRUE) : 
  more columns than column names

Nous recevons une erreur car nous n’avons pas réussi à spécifier que les valeurs de notre fichier sont séparées par des virgules.

Puisqu’il y a des espaces entre les valeurs dans les lignes du bloc de données mais pas dans l’en-tête, la fonction read.table() pense qu’il n’y a qu’une seule colonne.

Ainsi, cela nous indique qu’il y a plus de colonnes que de noms de colonnes.

Comment réparer l’erreur

La façon de corriger cette erreur consiste simplement à utiliser sep= » », lors de l’importation du fichier :

#import CSV file into data frame
df <- read.table("basketball_data.csv", header=TRUE, sep=",")

#view data frame
df
  team points rebounds
1    A     22       10
2    B     14        9
3    C     29        6
4    D     30        2

Nous sommes en mesure d’importer avec succès le fichier CSV sans aucune erreur car nous avons spécifié que les valeurs du fichier sont séparées par des virgules.

Alternativement, nous pourrions simplement utiliser read.csv() pour importer le fichier si nous savons qu’il s’agit d’un fichier CSV :

#import CSV file into data frame
df <- read.csv("basketball_data.csv", header=TRUE)

#view data frame
df

  team points rebounds
1  'A'     22       10
2  'B'     14        9
3  'C'     29        6
4  'D'     30        2

Notez que cette fois-ci, nous ne recevons aucune erreur non plus lors de l’importation du fichier CSV.

Ressources additionnelles

Les didacticiels suivants expliquent comment résoudre d’autres erreurs courantes dans R :

Comment réparer dans R : les noms ne correspondent pas aux noms précédents
Comment réparer dans R : la longueur d’un objet plus longue n’est pas un multiple de la longueur d’un objet plus courte
Comment réparer dans R : les contrastes ne peuvent être appliqués qu’à des facteurs avec 2 niveaux ou plus

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *