Cara menggabungkan banyak file csv di pandas (dengan contoh)
Anda dapat menggunakan sintaks dasar berikut untuk menggabungkan beberapa file CSV yang terletak di folder yang sama ke dalam pandas DataFrame:
import pandas as pd
import glob
import bone
#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '
#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))
#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )
Contoh khusus ini akan menggabungkan semua file CSV yang terletak di folder bernama my_data_files menjadi satu Pandas DataFrame.
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Menggabungkan beberapa file CSV di Pandas
Katakanlah saya memiliki folder di komputer saya bernama my_data_files yang berisi tiga file CSV:
Setiap file CSV berisi dua kolom yang disebut poin dan assist , yang mewakili poin dan assist dari pemain bola basket yang berbeda.
Berikut tampilan CSV pertama yang disebut df1 :
Kita dapat menggunakan sintaks berikut untuk menggabungkan tiga file CSV dalam folder menjadi satu pandas DataFrame:
import pandas as pd
import glob
import bone
#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '
#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))
#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )
#view resulting DataFrame
print (df)
assist points
0 4 3
1 5 2
2 5 4
3 6 4
4 8 6
5 9 3
6 2 3
7 10 2
8 14 9
9 15 3
10 6 10
11 8 6
12 9 4
Perhatikan bahwa ketiga file CSV telah berhasil diimpor dan digabungkan menjadi satu DataFrame.
DataFrame akhir berisi 13 baris dan 2 kolom.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_csv() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya dengan Python:
Pandas: Cara melewati baris saat membaca file CSV
Pandas: Cara menambahkan data ke file CSV yang sudah ada
Pandas: Cara menentukan tipe saat mengimpor file CSV
Pandas: Cara mengatur nama kolom saat mengimpor file CSV