Pandas: วิธีอ่านไฟล์ excel ด้วยเซลล์ที่ผสาน


เมื่อคุณอ่านไฟล์ Excel ที่มีเซลล์ที่ผสานเข้าไปใน DataFrame ของแพนด้า เซลล์ที่ผสานจะถูกเติมด้วยค่า NaN โดยอัตโนมัติ

วิธีที่ง่ายที่สุดในการกรอกค่า NaN เหล่านี้หลังจากนำเข้าไฟล์คือการใช้ฟังก์ชัน pandas fillna() ดังนี้:

 df = df. fillna (method=' ffill ', axis= 0 )

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: อ่านไฟล์ Excel ที่มีเซลล์ที่ผสานใน Pandas

สมมติว่าเรามีไฟล์ Excel ต่อไปนี้ชื่อ merged_data.xlsx ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเก็ตบอลหลายคน:

โปรดสังเกตว่าค่าในคอลัมน์ ทีม ถูกรวมเข้าด้วยกัน

ผู้เล่น A ถึง D เป็นของทีม Mavericks ในขณะที่ผู้เล่น E ถึง H เป็นของทีม Rockets

สมมติว่าเราใช้ฟังก์ชัน read_excel() เพื่ออ่านไฟล์ Excel นี้ลงใน DataFrame ของแพนด้า:

 import pandas as pd

#import Excel fie
df = pd. read_excel (' merged_data.xlsx ' )

#view DataFrame
print (df)

        Team Player Points Assists
0 Mavericks A 22 4
1 NaN B 29 4
2 NaN C 45 3
3 NaN D 30 7
4 Rockets E 29 8
5 NaN F 16 6
6 NaN G 25 9
7 NaN H 20 12

ตามค่าเริ่มต้น แพนด้าจะเติมเซลล์ที่ผสานด้วยค่า NaN

ในการเติมชื่อทีมแต่ละค่า NaN เหล่านี้ เราสามารถใช้ฟังก์ชัน fillna() ได้ดังนี้:

 #fill in NaN values with team names
df = df. fillna (method=' ffill ', axis= 0 )

#view updated DataFrame
print (df)

        Team Player Points Assists
0 Mavericks A 22 4
1 Mavericks B 29 4
2 Mavericks C 45 3
3 Mavericks D 30 7
4 Rockets E 29 8
5 Rockets F 16 6
6 Rockets G 25 9
7 Rockets M 20 12

โปรดทราบว่าแต่ละค่า NaN ได้รับการเติมด้วยชื่อทีมที่เหมาะสม

โปรดทราบว่าอาร์กิวเมนต์ axis=0 บอกให้แพนด้าเติมค่า NaN ในแนวตั้ง

หากต้องการเติมค่า NaN ในแนวนอนในคอลัมน์ คุณสามารถระบุ axis=1 ได้

หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas fillna() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ Excel
Pandas: วิธีระบุประเภทเมื่อนำเข้าไฟล์ Excel
Pandas: วิธีรวมแผ่นงาน Excel หลายแผ่น

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *