R : Importer un fichier CSV avec des noms de colonnes contenant des espaces
Si vous importez un fichier CSV dans R contenant des noms de colonnes avec des espaces, R remplacera automatiquement les espaces par des points pour que les noms de colonnes aient des noms de variables « valides ».
Si vous souhaitez importer le fichier CSV et conserver les espaces dans les noms de colonnes, vous devez utiliser l’argument check.names=FALSE comme suit :
df <- read.csv("my_data.csv", check.names=FALSE)
Cela importera le fichier CSV dans R et conservera les espaces dans les noms de colonnes.
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : importer un fichier CSV dans R avec des noms de colonnes contenant des espaces
Supposons que nous ayons le fichier CSV suivant appelé basketball.csv :
Notez qu’il y a quatre noms de colonnes dans le fichier CSV et que deux d’entre elles contiennent des espaces dans le nom.
Si nous utilisons la fonction read.csv() pour importer ce fichier CSV, R remplacera automatiquement les espaces par des points :
#import CSV file
df <- read.csv('basketball_data.csv')
#view data frame
df
team points.scored assists.collected rebounds
1 A 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Notez que les points ont remplacé les espaces dans les noms de deux colonnes par des espaces.
Si vous souhaitez importer le fichier CSV et conserver les espaces dans les noms de colonnes, vous pouvez utiliser l’argument check.names=FALSE comme suit :
#import CSV file and keep spaces in column names
df <- read.csv('basketball_data.csv', check.names=FALSE)
#view data frame
df
team points scored assists collected rebounds
1 A 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3
Notez que les espaces ont été conservés dans les noms de deux colonnes avec des espaces.
Cependant, vous devez noter que si vous tentez d’effectuer des calculs en utilisant ces noms de colonnes avec des espaces, vous devez les entourer de guillemets simples (`), sinon vous recevrez une erreur.
Par exemple, si vous essayez de calculer la somme des valeurs dans la colonne des points marqués sans utiliser de guillemets simples, vous recevrez une erreur :
#attempt to calculate sum of points scored column
sum(df$points scored)
Error: unexpected symbol in "sum(df$points scored"
Au lieu de cela, vous devez entourer le nom de la colonne entre guillemets simples (`) comme suit :
#calculate sum of points scored column
sum(df$`points scored`)
[1] 101
Notez que nous ne recevons pas d’erreur cette fois.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment lire un CSV à partir d’une URL dans R
Comment fusionner plusieurs fichiers CSV dans R
Comment lire des lignes spécifiques d’un fichier CSV dans R
Comment exporter une trame de données vers un fichier CSV dans R