วิธีรวมไฟล์ csv หลายไฟล์ใน pandas (พร้อมตัวอย่าง)


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อรวมไฟล์ CSV หลายไฟล์ที่อยู่ในโฟลเดอร์เดียวกันลงใน Pandas DataFrame:

 import pandas as pd
import glob
import bone

#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '

#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))

#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )

ตัวอย่างนี้จะรวมไฟล์ CSV ทั้งหมดที่อยู่ในโฟลเดอร์ชื่อ my_data_files ให้เป็น Pandas DataFrame เดียว

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: รวมไฟล์ CSV หลายไฟล์ใน Pandas

สมมติว่าฉันมีโฟลเดอร์ในคอมพิวเตอร์ชื่อ my_data_files ซึ่งมีไฟล์ CSV สามไฟล์:

ไฟล์ CSV แต่ละไฟล์มีสองคอลัมน์ที่เรียกว่า คะแนน และ การช่วยเหลือ ซึ่งแสดงถึงคะแนนและการช่วยเหลือของผู้เล่นบาสเกตบอลที่แตกต่างกัน

นี่คือลักษณะของ CSV แรกที่เรียกว่า df1 :

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อรวมไฟล์ CSV สามไฟล์ในโฟลเดอร์ให้เป็น DataFrame แพนด้าตัวเดียว:

 import pandas as pd
import glob
import bone

#define path to CSV files
path = r' C:\Users\bob\Documents\my_data_files '

#identify all CSV files
all_files = glob. glob ( os.path.join (" *.csv " ))

#merge all CSV files into one DataFrame
df = pd. concat ((pd. read_csv (f) for f in all_files), ignore_index= True )

#view resulting DataFrame
print (df)

    assist points
0 4 3
1 5 2
2 5 4
3 6 4
4 8 6
5 9 3
6 2 3
7 10 2
8 14 9
9 15 3
10 6 10
11 8 6
12 9 4

โปรดทราบว่าไฟล์ CSV ทั้งสามไฟล์ได้รับการนำเข้าและรวมเป็น DataFrame เดียวเรียบร้อยแล้ว

DataFrame สุดท้ายประกอบด้วย 13 แถวและ 2 คอลัมน์

หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas read_csv() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีทำงานทั่วไปอื่นๆ ใน Python:

Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ CSV
Pandas: วิธีเพิ่มข้อมูลลงในไฟล์ CSV ที่มีอยู่
Pandas: วิธีระบุประเภทเมื่อนำเข้าไฟล์ CSV
Pandas: วิธีตั้งชื่อคอลัมน์เมื่อนำเข้าไฟล์ CSV

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *