Pandas: วิธีระบุประเภทเมื่อนำเข้าไฟล์ excel


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อระบุประเภทของแต่ละคอลัมน์ใน DataFrame เมื่อนำเข้าไฟล์ Excel ลงในแพนด้า:

 df = pd. read_excel (' my_data.xlsx ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

อาร์กิวเมนต์ dtype ระบุประเภทข้อมูลที่แต่ละคอลัมน์ควรมีเมื่อนำเข้าไฟล์ Excel ไปยัง DataFrame ของแพนด้า

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: ระบุประเภทเมื่อนำเข้าไฟล์ Excel ลงใน Pandas

สมมติว่าเรามีไฟล์ Excel ต่อไปนี้ชื่อ player_data.xlsx :

หากเรานำเข้าไฟล์ Excel โดยใช้ฟังก์ชัน read_excel() แพนด้าจะพยายามระบุประเภทข้อมูลสำหรับแต่ละคอลัมน์โดยอัตโนมัติ:

 import pandas as pd

#import Excel file
df = pd. read_excel (' player_data.xlsx ')

#view resulting DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 B 20 12 3
2 C 15 4 7
3 D 19 4 8
4 E 32 6 8
5 F 13 7 9

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
assists int64
dtype:object

จากผลลัพธ์เราจะเห็นว่าคอลัมน์ของ DataFrame มีประเภทข้อมูลดังต่อไปนี้

  • ทีม : object
  • คะแนน : int64
  • ตีกลับ : int64
  • แอสซิสต์ : int64

อย่างไรก็ตาม เราสามารถใช้อาร์กิวเมนต์ dtype ในฟังก์ชัน read_excel() เพื่อระบุประเภทข้อมูลที่แต่ละคอลัมน์ควรมี:

import pandas as pd

#import Excel file and specify dtypes of columns
df = pd. read_excel (' player_data.xlsx ',
                   dtype = {' team ': str , ' points ': float , ' rebounds ': int ,
                            ' assists ': float })

#view resulting DataFrame
print (df)

  team points rebound assists
0 A 24.0 8 5.0
1 B 20.0 12 3.0
2 C 15.0 4 7.0
3 D 19.0 4 8.0
4 E 32.0 6 8.0
5 F 13.0 7 9.0

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
assist float64
dtype:object

จากผลลัพธ์เราจะเห็นว่าคอลัมน์ของ DataFrame มีประเภทข้อมูลดังต่อไปนี้

  • ทีม : object
  • คะแนน : float64
  • การตีกลับ : int32
  • แอสซิสต์ : float64

ประเภทข้อมูลเหล่านี้สอดคล้องกับประเภทข้อมูลที่เราระบุโดยใช้อาร์กิวเมนต์ dtype

โปรดทราบว่าในตัวอย่างนี้ เราได้ระบุประเภทสำหรับแต่ละคอลัมน์ใน DataFrame

อย่างไรก็ตาม คุณสามารถเลือกระบุประเภทสำหรับคอลัมน์ที่ต้องการเท่านั้น และให้แพนด้าอนุมานประเภทของคอลัมน์ที่เหลือได้

หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของฟังก์ชัน pandas read_excel() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

Pandas: วิธีข้ามบรรทัดเมื่ออ่านไฟล์ Excel
Pandas: วิธีรวมแผ่นงาน Excel หลายแผ่น
Pandas: วิธีเขียน DataFrames บนแผ่นงาน Excel หลายแผ่น

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *