Comment importer des fichiers CSV dans R (étape par étape)



Supposons que j’ai un fichier CSV appelé data.csv enregistré à l’emplacement suivant :

C:\Utilisateurs\Bob\Desktop\data.csv

Et supposons que le fichier CSV contienne les données suivantes :

team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Il existe trois manières courantes d’importer ce fichier CSV dans R :

1. Utilisez read.csv à partir de la base R (méthode la plus lente, mais fonctionne bien pour les ensembles de données plus petits)

data1 <- read.csv("C:\\Users\\Bob\\Desktop\\data.csv", header=TRUE, stringsAsFactors=FALSE)

2. Utilisez read_csv du package readr (2 à 3 fois plus rapide que read.csv)

library(readr)

data2 <- read_csv("C:\\Users\\Bob\\Desktop\\data.csv")

3. Utilisez fread du package data.table (2 à 3 fois plus rapide que read_csv)

library(data.table)

data3 <- fread("C:\\Users\\Bob\\Desktop\\data.csv")

Ce didacticiel montre un exemple d’utilisation de chacune de ces méthodes pour importer le fichier CSV dans R.

Méthode 1 : utilisation de read.csv

Si votre fichier CSV est raisonnablement petit, vous pouvez simplement utiliser la fonction read.csv de Base R pour l’importer.

Lorsque vous utilisez cette méthode, assurez-vous de spécifier stringsAsFactors=FALSE afin que R ne convertisse pas les variables alphabétiques ou catégorielles en facteurs.

Le code suivant montre comment utiliser read.csv pour importer ce fichier CSV dans R :

#import data
data1 <- read.csv("C:\\Users\\Bob\\Desktop\\data.csv", header=TRUE, stringsAsFactors=FALSE)

#view structure of data
str(data1)

'data.frame':   5 obs. of  3 variables:
 $ team   : chr  "'A'" "'B'" "'C'" "'D'" ...
 $ points : int  78 85 93 90 91
 $ assists: int  12 20 23 8 14

Méthode 2 : utilisation de read_csv

Si vous travaillez avec des fichiers plus volumineux, vous pouvez utiliser la fonction read_csv du package readr :

library(readr)

#import data
data2 <- read_csv("C:\\Users\\Bob\\Desktop\\data.csv")

#view structure of data
str(data2)

'data.frame': 5 obs. of 3 variables:
 $ team : chr "'A'" "'B'" "'C'" "'D'" ...
 $ points : int 78 85 93 90 91
 $ assists: int 12 20 23 8 14

Méthode 3 : Utiliser fread

Si votre CSV est extrêmement volumineux, le moyen le plus rapide de l’importer dans R consiste à utiliser la fonction fread du package data.table :

library(data.table)

#import data
data3 <- fread("C:\\Users\\Bob\\Desktop\\data.csv")

#view structure of data
str(data3)

Classes 'data.table' and 'data.frame':  5 obs. of  3 variables:
 $ team   : chr  "'A'" "'B'" "'C'" "'D'" ...
 $ points : int  78 85 93 90 91
 $ assists: int  12 20 23 8 14

Notez que dans chaque exemple, nous avons utilisé des doubles barres obliques inverses (\\) dans le chemin du fichier pour éviter l’erreur courante suivante :

Error: '\U' used without hex digits in character string starting ""C:\U"

Ressources additionnelles

Les didacticiels suivants expliquent comment importer d’autres types de fichiers dans R :

Comment importer des fichiers Excel dans R
Comment importer des fichiers TSV dans R
Comment importer des fichiers Zip dans R
Comment importer des fichiers SAS dans R
Comment importer des fichiers .dta dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *