วิธีรวมไฟล์ csv หลายไฟล์ใน pandas (พร้อมตัวอย่าง)
คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อรวมไฟล์ CSV หลายไฟล์ที่อยู่ในโฟลเดอร์เดียวกันลงใน Pandas DataFrame:
import pandas as pd
import glob
import bone
#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '
#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))
#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )
ตัวอย่างนี้จะรวมไฟล์ CSV ทั้งหมดที่อยู่ในโฟลเดอร์ชื่อ my_data_files ให้เป็น Pandas DataFrame เดียว
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: รวมไฟล์ CSV หลายไฟล์ใน Pandas
สมมติว่าฉันมีโฟลเดอร์ในคอมพิวเตอร์ชื่อ my_data_files ซึ่งมีไฟล์ CSV สามไฟล์:
ไฟล์ CSV แต่ละไฟล์มีสองคอลัมน์ที่เรียกว่า คะแนน และ การช่วยเหลือ ซึ่งแสดงถึงคะแนนและการช่วยเหลือของผู้เล่นบาสเกตบอลที่แตกต่างกัน
นี่คือลักษณะของ CSV แรกที่เรียกว่า df1 :
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อรวมไฟล์ CSV สามไฟล์ในโฟลเดอร์ให้เป็น DataFrame แพนด้าตัวเดียว:
import pandas as pd
import glob
import bone
#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '
#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))
#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )
#view resulting DataFrame
print (df)
assist points
0 4 3
1 5 2
2 5 4
3 6 4
4 8 6
5 9 3
6 2 3
7 10 2
8 14 9
9 15 3
10 6 10
11 8 6
12 9 4
โปรดทราบว่าไฟล์ CSV ทั้งสามไฟล์ได้รับการนำเข้าและรวมเป็น DataFrame เดียวเรียบร้อยแล้ว
DataFrame สุดท้ายประกอบด้วย 13 แถวและ 2 คอลัมน์
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas read_csv() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีทำงานทั่วไปอื่นๆ ใน Python:
Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ CSV
Pandas: วิธีเพิ่มข้อมูลลงในไฟล์ CSV ที่มีอยู่
Pandas: วิธีระบุประเภทเมื่อนำเข้าไฟล์ CSV
Pandas: วิธีตั้งชื่อคอลัมน์เมื่อนำเข้าไฟล์ CSV