Come unire più file csv in panda (con esempio)
È possibile utilizzare la seguente sintassi di base per unire più file CSV situati nella stessa cartella in un DataFrame panda:
import pandas as pd
import glob
import bone
#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '
#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))
#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )
Questo particolare esempio unirà tutti i file CSV che si trovano nella cartella denominata my_data_files in un singolo Pandas DataFrame.
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: unisci più file CSV in Panda
Diciamo che ho una cartella sul mio computer chiamata my_data_files che contiene tre file CSV:
Ogni file CSV contiene due colonne denominate punti e assist , che rappresentano i punti e gli assist di diversi giocatori di basket.
Ecco come appare il primo CSV chiamato df1 :
Possiamo utilizzare la seguente sintassi per unire i tre file CSV nella cartella in un unico DataFrame panda:
import pandas as pd
import glob
import bone
#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '
#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))
#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )
#view resulting DataFrame
print (df)
assist points
0 4 3
1 5 2
2 5 4
3 6 4
4 8 6
5 9 3
6 2 3
7 10 2
8 14 9
9 15 3
10 6 10
11 8 6
12 9 4
Tieni presente che tutti e tre i file CSV sono stati importati e uniti con successo in un singolo DataFrame.
Il DataFrame finale contiene 13 righe e 2 colonne.
Nota : puoi trovare la documentazione completa della funzione panda read_csv() qui .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in Python:
Panda: come saltare le righe durante la lettura di un file CSV
Panda: come aggiungere dati a un file CSV esistente
Panda: come specificare i tipi durante l’importazione di un file CSV
Panda: come impostare i nomi delle colonne durante l’importazione di un file CSV