Pandas: วิธีระบุประเภทเมื่อนำเข้าไฟล์ excel
คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อระบุประเภทของแต่ละคอลัมน์ใน DataFrame เมื่อนำเข้าไฟล์ Excel ลงในแพนด้า:
df = pd. read_excel (' my_data.xlsx ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
อาร์กิวเมนต์ dtype ระบุประเภทข้อมูลที่แต่ละคอลัมน์ควรมีเมื่อนำเข้าไฟล์ Excel ไปยัง DataFrame ของแพนด้า
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: ระบุประเภทเมื่อนำเข้าไฟล์ Excel ลงใน Pandas
สมมติว่าเรามีไฟล์ Excel ต่อไปนี้ชื่อ player_data.xlsx :
หากเรานำเข้าไฟล์ Excel โดยใช้ฟังก์ชัน read_excel() แพนด้าจะพยายามระบุประเภทข้อมูลสำหรับแต่ละคอลัมน์โดยอัตโนมัติ:
import pandas as pd #import Excel file df = pd. read_excel (' player_data.xlsx ') #view resulting DataFrame print (df) team points rebound assists 0 to 24 8 5 1 B 20 12 3 2 C 15 4 7 3 D 19 4 8 4 E 32 6 8 5 F 13 7 9 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 assists int64 dtype:object
จากผลลัพธ์เราจะเห็นว่าคอลัมน์ของ DataFrame มีประเภทข้อมูลดังต่อไปนี้
- ทีม : object
- คะแนน : int64
- ตีกลับ : int64
- แอสซิสต์ : int64
อย่างไรก็ตาม เราสามารถใช้อาร์กิวเมนต์ dtype ในฟังก์ชัน read_excel() เพื่อระบุประเภทข้อมูลที่แต่ละคอลัมน์ควรมี:
import pandas as pd #import Excel file and specify dtypes of columns df = pd. read_excel (' player_data.xlsx ', dtype = {' team ': str , ' points ': float , ' rebounds ': int , ' assists ': float }) #view resulting DataFrame print (df) team points rebound assists 0 A 24.0 8 5.0 1 B 20.0 12 3.0 2 C 15.0 4 7.0 3 D 19.0 4 8.0 4 E 32.0 6 8.0 5 F 13.0 7 9.0 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 assist float64 dtype:object
จากผลลัพธ์เราจะเห็นว่าคอลัมน์ของ DataFrame มีประเภทข้อมูลดังต่อไปนี้
- ทีม : object
- คะแนน : float64
- การตีกลับ : int32
- แอสซิสต์ : float64
ประเภทข้อมูลเหล่านี้สอดคล้องกับประเภทข้อมูลที่เราระบุโดยใช้อาร์กิวเมนต์ dtype
โปรดทราบว่าในตัวอย่างนี้ เราได้ระบุประเภทสำหรับแต่ละคอลัมน์ใน DataFrame
อย่างไรก็ตาม คุณสามารถเลือกระบุประเภทสำหรับคอลัมน์ที่ต้องการเท่านั้น และให้แพนด้าอนุมานประเภทของคอลัมน์ที่เหลือได้
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas read_excel() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:
Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ Excel
Pandas: วิธีรวมแผ่นงาน Excel หลายแผ่น
Pandas: วิธีเขียน DataFrames บนแผ่นงาน Excel หลายแผ่น