Comment importer des fichiers CSV dans R (étape par étape)
Supposons que j’ai un fichier CSV appelé data.csv enregistré à l’emplacement suivant :
C:\Utilisateurs\Bob\Desktop\data.csv
Et supposons que le fichier CSV contienne les données suivantes :
team, points, assists 'A', 78, 12 'B', 85, 20 'C', 93, 23 'D', 90, 8 'E', 91, 14
Il existe trois manières courantes d’importer ce fichier CSV dans R :
1. Utilisez read.csv à partir de la base R (méthode la plus lente, mais fonctionne bien pour les ensembles de données plus petits)
data1 <- read.csv("C:\\Users\\Bob\\Desktop\\data.csv", header=TRUE, stringsAsFactors=FALSE)
2. Utilisez read_csv du package readr (2 à 3 fois plus rapide que read.csv)
library(readr) data2 <- read_csv("C:\\Users\\Bob\\Desktop\\data.csv")
3. Utilisez fread du package data.table (2 à 3 fois plus rapide que read_csv)
library(data.table) data3 <- fread("C:\\Users\\Bob\\Desktop\\data.csv")
Ce didacticiel montre un exemple d’utilisation de chacune de ces méthodes pour importer le fichier CSV dans R.
Méthode 1 : utilisation de read.csv
Si votre fichier CSV est raisonnablement petit, vous pouvez simplement utiliser la fonction read.csv de Base R pour l’importer.
Lorsque vous utilisez cette méthode, assurez-vous de spécifier stringsAsFactors=FALSE afin que R ne convertisse pas les variables alphabétiques ou catégorielles en facteurs.
Le code suivant montre comment utiliser read.csv pour importer ce fichier CSV dans R :
#import data data1 <- read.csv("C:\\Users\\Bob\\Desktop\\data.csv", header=TRUE, stringsAsFactors=FALSE) #view structure of data str(data1) 'data.frame': 5 obs. of 3 variables: $ team : chr "'A'" "'B'" "'C'" "'D'" ... $ points : int 78 85 93 90 91 $ assists: int 12 20 23 8 14
Méthode 2 : utilisation de read_csv
Si vous travaillez avec des fichiers plus volumineux, vous pouvez utiliser la fonction read_csv du package readr :
library(readr) #import data data2 <- read_csv("C:\\Users\\Bob\\Desktop\\data.csv") #view structure of data str(data2) 'data.frame': 5 obs. of 3 variables: $ team : chr "'A'" "'B'" "'C'" "'D'" ... $ points : int 78 85 93 90 91 $ assists: int 12 20 23 8 14
Méthode 3 : Utiliser fread
Si votre CSV est extrêmement volumineux, le moyen le plus rapide de l’importer dans R consiste à utiliser la fonction fread du package data.table :
library(data.table) #import data data3 <- fread("C:\\Users\\Bob\\Desktop\\data.csv") #view structure of data str(data3) Classes 'data.table' and 'data.frame': 5 obs. of 3 variables: $ team : chr "'A'" "'B'" "'C'" "'D'" ... $ points : int 78 85 93 90 91 $ assists: int 12 20 23 8 14
Notez que dans chaque exemple, nous avons utilisé des doubles barres obliques inverses (\\) dans le chemin du fichier pour éviter l’erreur courante suivante :
Error: '\U' used without hex digits in character string starting ""C:\U"
Ressources additionnelles
Les didacticiels suivants expliquent comment importer d’autres types de fichiers dans R :
Comment importer des fichiers Excel dans R
Comment importer des fichiers TSV dans R
Comment importer des fichiers Zip dans R
Comment importer des fichiers SAS dans R
Comment importer des fichiers .dta dans R