Comment fusionner plusieurs fichiers CSV dans Pandas (avec exemple)



Vous pouvez utiliser la syntaxe de base suivante pour fusionner plusieurs fichiers CSV situés dans le même dossier dans un DataFrame pandas :

import pandas as pd
import glob
import os

#define path to CSV files
path = r'C:\Users\bob\Documents\my_data_files'

#identify all CSV files
all_files = glob.glob(os.path.join("*.csv"))

#merge all CSV files into one DataFrame
df = pd.concat((pd.read_csv(f) for f in all_files), ignore_index=True)

Cet exemple particulier fusionnera tous les fichiers CSV situés dans le dossier appelé my_data_files en un seul Pandas DataFrame.

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : fusionner plusieurs fichiers CSV dans Pandas

Supposons que j’ai un dossier sur mon ordinateur appelé my_data_files qui contient trois fichiers CSV :

Chaque fichier CSV contient deux colonnes appelées points et passes décisives , qui représentent les points et passes décisives de différents joueurs de basket-ball.

Voici à quoi ressemble le premier CSV appelé df1 :

Nous pouvons utiliser la syntaxe suivante pour fusionner les trois fichiers CSV du dossier en un seul DataFrame pandas :

import pandas as pd
import glob
import os

#define path to CSV files
path = r'C:\Users\bob\Documents\my_data_files'

#identify all CSV files
all_files = glob.glob(os.path.join("*.csv"))

#merge all CSV files into one DataFrame
df = pd.concat((pd.read_csv(f) for f in all_files), ignore_index=True)

#view resulting DataFrame
print(df)

    points  assists
0        4        3
1        5        2
2        5        4
3        6        4
4        8        6
5        9        3
6        2        3
7       10        2
8       14        9
9       15        3
10       6       10
11       8        6
12       9        4

Notez que les trois fichiers CSV ont été importés et fusionnés avec succès dans un seul DataFrame.

Le DataFrame final contient 13 lignes et 2 colonnes.

Remarque : Vous pouvez trouver la documentation complète de la fonction pandas read_csv() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes en Python :

Pandas : Comment ignorer des lignes lors de la lecture d’un fichier CSV
Pandas : Comment ajouter des données à un fichier CSV existant
Pandas : Comment spécifier les types lors de l’importation d’un fichier CSV
Pandas : Comment définir les noms de colonnes lors de l’importation d’un fichier CSV

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *