Pandas: ตั้งชื่อคอลัมน์เมื่อนำเข้าไฟล์ excel


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อกำหนดชื่อคอลัมน์ของ DataFrame เมื่อนำเข้าไฟล์ Excel ลงในแพนด้า:

 colnames = [' col1 ', ' col2 ', ' col3 ']

df = pd. read_excel (' my_data.xlsx ', names=colnames)

อาร์กิวเมนต์ ชื่อ ใช้รายการชื่อที่คุณต้องการใช้สำหรับคอลัมน์ใน DataFrame

เมื่อใช้อาร์กิวเมนต์นี้ คุณจะบอกให้แพนด้าใช้แถวแรกของไฟล์ Excel เป็นแถวแรกของ DataFrame แทนที่จะใช้เป็นแถวส่วนหัว

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: ตั้งชื่อคอลัมน์เมื่อนำเข้าไฟล์ Excel ไปยัง Pandas

สมมติว่าเรามีไฟล์ Excel ต่อไปนี้ชื่อ Players_data.xlsx :

จากไฟล์เราจะเห็นว่าแถวแรกไม่มีชื่อคอลัมน์ใดๆ

หากเรานำเข้าไฟล์ Excel โดยใช้ฟังก์ชัน read_excel() แพนด้าจะพยายามใช้ค่าในแถวแรกเป็นชื่อคอลัมน์สำหรับ DataFrame:

 import pandas as pd

#import Excel file
df = pd. read_excel (' players_data.xlsx ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

อย่างไรก็ตาม เราสามารถใช้อาร์กิวเมนต์ ชื่อ เพื่อระบุชื่อคอลัมน์ของเราเองเมื่อนำเข้าไฟล์ Excel:

 import pandas as pd

#specify column names
colnames = [' team ', ' points ', ' rebounds ']

#import Excel file and use specified column names
df = pd. read_excel (' players_data.xlsx ', names = colnames)

#view resulting DataFrame
print (df)

  team points rebounds
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

โปรดทราบว่าแถวแรกของไฟล์ Excel จะไม่ถูกใช้เป็นแถวส่วนหัวอีกต่อไป

ตอนนี้ชื่อคอลัมน์ที่เราระบุโดยใช้อาร์กิวเมนต์ ชื่อ จะถูกนำมาใช้เป็นชื่อคอลัมน์แทน

หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas read_excel() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

Pandas: วิธีอ่านไฟล์ Excel ด้วยเซลล์ที่ผสาน
Pandas: ละเว้นคอลัมน์เฉพาะเมื่อนำเข้าไฟล์ Excel
Pandas: วิธีระบุประเภทเมื่อนำเข้าไฟล์ Excel
Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ Excel

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *