Comment utiliser fread() dans R pour importer des fichiers plus rapidement



Vous pouvez utiliser la fonction fread() du package data.table dans R pour importer des fichiers rapidement et facilement.

Cette fonction utilise la syntaxe de base suivante :

library(data.table)

df <- fread("C:\\Users\\Path\\To\\My\\data.csv")

Pour les fichiers volumineux, cette fonction s’est avérée nettement plus rapide que des fonctions telles que read.csv à partir de la base R.

Et dans la plupart des cas, cette fonction peut également détecter automatiquement les types de délimiteur et de colonne pour l’ensemble de données que vous importez.

L’exemple suivant montre comment utiliser cette fonction dans la pratique.

Exemple : Comment utiliser fread() pour importer des fichiers dans R

Supposons que j’ai un fichier CSV appelé data.csv enregistré à l’emplacement suivant :

C:\Utilisateurs\Bob\Desktop\data.csv

Et supposons que le fichier CSV contienne les données suivantes :

team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Je peux utiliser la fonction fread() du package data.table pour importer ce fichier dans mon environnement R actuel :

library(data.table)

#import data
df <- fread("C:\\Users\\Bob\\Desktop\\data.csv")

#view data
df

  team points assists
1    A     78      12
2    B     85      20
3    C     93      23
4    D     90       8
5    E     91      14

Nous sommes en mesure d’importer avec succès le fichier CSV à l’aide de la fonction fread() .

Remarque : Nous avons utilisé des doubles barres obliques inverses (\\) dans le chemin du fichier pour éviter une erreur d’importation courante .

Notez que nous n’avons pas non plus eu besoin de spécifier le délimiteur puisque la fonction fread() a automatiquement détecté qu’il s’agissait d’une virgule.

Si nous utilisons la fonction str() pour afficher la structure du bloc de données, nous pouvons voir que la fonction fread() a également identifié automatiquement le type d’objet pour chaque colonne :

#view structure of data
str(df)

Classes 'data.table' and 'data.frame':  5 obs. of  3 variables:
 $ team   : chr  "'A'" "'B'" "'C'" "'D'" ...
 $ points : int  78 85 93 90 91
 $ assists: int  12 20 23 8 14

À partir du résultat, nous pouvons voir :

  • La variable team est un personnage.
  • La variable points est un entier.
  • La variable d’assistance est un entier.

Dans cet exemple, nous avons utilisé un petit bloc de données pour plus de simplicité (5 lignes x 3 colonnes), mais en pratique, la fonction fread() est capable d’importer rapidement et efficacement des blocs de données contenant des dizaines de milliers de lignes, ce qui en fait la méthode d’importation préférée pour des ensembles de données à grande échelle.

Ressources additionnelles

Les didacticiels suivants expliquent comment importer des types de fichiers spécifiques dans R :

Comment importer des fichiers Excel dans R
Comment importer des fichiers TSV dans R
Comment importer des fichiers Zip dans R
Comment importer des fichiers SAS dans R
Comment importer des fichiers .dta dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *