Pandas: วิธีอ่านไฟล์ excel ด้วยเซลล์ที่ผสาน
เมื่อคุณอ่านไฟล์ Excel ที่มีเซลล์ที่ผสานเข้าไปใน DataFrame ของแพนด้า เซลล์ที่ผสานจะถูกเติมด้วยค่า NaN โดยอัตโนมัติ
วิธีที่ง่ายที่สุดในการกรอกค่า NaN เหล่านี้หลังจากนำเข้าไฟล์คือการใช้ฟังก์ชัน pandas fillna() ดังนี้:
df = df. fillna (method=' ffill ', axis= 0 )
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: อ่านไฟล์ Excel ที่มีเซลล์ที่ผสานใน Pandas
สมมติว่าเรามีไฟล์ Excel ต่อไปนี้ชื่อ merged_data.xlsx ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเก็ตบอลหลายคน:
โปรดสังเกตว่าค่าในคอลัมน์ ทีม ถูกรวมเข้าด้วยกัน
ผู้เล่น A ถึง D เป็นของทีม Mavericks ในขณะที่ผู้เล่น E ถึง H เป็นของทีม Rockets
สมมติว่าเราใช้ฟังก์ชัน read_excel() เพื่ออ่านไฟล์ Excel นี้ลงใน DataFrame ของแพนด้า:
import pandas as pd #import Excel fie df = pd. read_excel (' merged_data.xlsx ' ) #view DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 NaN B 29 4 2 NaN C 45 3 3 NaN D 30 7 4 Rockets E 29 8 5 NaN F 16 6 6 NaN G 25 9 7 NaN H 20 12
ตามค่าเริ่มต้น แพนด้าจะเติมเซลล์ที่ผสานด้วยค่า NaN
ในการเติมชื่อทีมแต่ละค่า NaN เหล่านี้ เราสามารถใช้ฟังก์ชัน fillna() ได้ดังนี้:
#fill in NaN values with team names df = df. fillna (method=' ffill ', axis= 0 ) #view updated DataFrame print (df) Team Player Points Assists 0 Mavericks A 22 4 1 Mavericks B 29 4 2 Mavericks C 45 3 3 Mavericks D 30 7 4 Rockets E 29 8 5 Rockets F 16 6 6 Rockets G 25 9 7 Rockets M 20 12
โปรดทราบว่าแต่ละค่า NaN ได้รับการเติมด้วยชื่อทีมที่เหมาะสม
โปรดทราบว่าอาร์กิวเมนต์ axis=0 บอกให้แพนด้าเติมค่า NaN ในแนวตั้ง
หากต้องการเติมค่า NaN ในแนวนอนในคอลัมน์ คุณสามารถระบุ axis=1 ได้
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas fillna() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:
Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ Excel
Pandas: วิธีระบุประเภทเมื่อนำเข้าไฟล์ Excel
Pandas: วิธีรวมแผ่นงาน Excel หลายแผ่น