Comment fusionner plusieurs fichiers CSV dans R (exemple étape par étape)



Vous pouvez utiliser la syntaxe de base suivante pour importer et fusionner plusieurs fichiers CSV situés dans le même dossier dans R :

df <- list.files(path='C:/my/path/to/files') %>% 
  lapply(read_csv) %>% 
  bind_rows

L’exemple suivant étape par étape montre comment utiliser cette syntaxe dans la pratique.

Étape 1 : Créer et exporter plusieurs blocs de données

Tout d’abord, nous allons utiliser le code suivant pour créer et exporter trois blocs de données vers des fichiers CSV :

#create three data frames
df1 <- data.frame(points=c(4, 5, 5, 6, 8, 9),
                  assists=c(3, 2, 4, 4, 6, 3))

df2 <- data.frame(points=c(2, 10, 14, 15),
                  assists=c(3, 2, 9, 3))

df3 <- data.frame(points=c(6, 8, 9),
                  assists=c(10, 6, 4))

#export all three data frames to CSV files
write.csv(df1, 'C:/Users/bob/Documents/my_data_files/df1.csv', row.names=FALSE)
write.csv(df2, 'C:/Users/bob/Documents/my_data_files/df2.csv', row.names=FALSE)
write.csv(df3, 'C:/Users/bob/Documents/my_data_files/df3.csv', row.names=FALSE)

Je peux accéder à ce dossier et voir que les trois fichiers CSV ont été exportés avec succès :

Étape 2 : Importer et fusionner plusieurs fichiers CSV

Ensuite, nous utiliserons le code suivant pour importer et fusionner les trois fichiers CSV en un seul bloc de données dans R :

library(dplyr)
library(readr)

#import and merge all three CSV files into one data frame
df <- list.files(path='C:/Users/bob/Documents/my_data_files') %>% 
  lapply(read_csv) %>% 
  bind_rows 

#view resulting data frame
df

# A tibble: 13 x 2
   points assists
       
 1      4       3
 2      5       2
 3      5       4
 4      6       4
 5      8       6
 6      9       3
 7      2       3
 8     10       2
 9     14       9
10     15       3
11      6      10
12      8       6
13      9       4

Notez que les trois fichiers CSV ont été fusionnés avec succès en un seul bloc de données.

Nous pouvons voir que le bloc de données résultant comporte 13 lignes et 2 colonnes.

Remarque : Si les blocs de données n’ont pas de noms de colonnes correspondants, R fusionnera toujours tous les blocs de données et remplira simplement les valeurs manquantes avec des valeurs NA .

Ressources additionnelles

Les didacticiels suivants expliquent comment utiliser d’autres types de fichiers dans R :

Comment importer des fichiers Excel dans R
Comment importer des fichiers TSV dans R
Comment importer des fichiers Zip dans R
Comment importer des fichiers SAS dans R
Comment importer des fichiers .dta dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *