Pandas: cara menentukan tipe saat mengimpor file excel
Anda dapat menggunakan sintaks dasar berikut untuk menentukan tipe setiap kolom dalam DataFrame saat mengimpor file Excel ke pandas:
df = pd. read_excel (' my_data.xlsx ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
Argumen dtype menentukan tipe data yang harus dimiliki setiap kolom saat mengimpor file Excel ke dalam pandas DataFrame.
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Tentukan Jenis Saat Mengimpor File Excel ke Pandas
Katakanlah kita memiliki file Excel berikut bernama player_data.xlsx :
Jika kita mengimpor file Excel menggunakan fungsi read_excel() , panda akan mencoba mengidentifikasi tipe data untuk setiap kolom secara otomatis:
import pandas as pd #import Excel file df = pd. read_excel (' player_data.xlsx ') #view resulting DataFrame print (df) team points rebound assists 0 to 24 8 5 1 B 20 12 3 2 C 15 4 7 3 D 19 4 8 4 E 32 6 8 5 F 13 7 9 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 assists int64 dtype:object
Dari hasilnya, kita dapat melihat bahwa kolom DataFrame memiliki tipe data berikut:
- tim :objek
- poin : int64
- memantul : int64
- bantuan : int64
Namun, kita bisa menggunakan argumen dtype dalam fungsi read_excel() untuk menentukan tipe data yang harus dimiliki setiap kolom:
import pandas as pd #import Excel file and specify dtypes of columns df = pd. read_excel (' player_data.xlsx ', dtype = {' team ': str , ' points ': float , ' rebounds ': int , ' assists ': float }) #view resulting DataFrame print (df) team points rebound assists 0 A 24.0 8 5.0 1 B 20.0 12 3.0 2 C 15.0 4 7.0 3 D 19.0 4 8.0 4 E 32.0 6 8.0 5 F 13.0 7 9.0 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 assist float64 dtype:object
Dari hasilnya, kita dapat melihat bahwa kolom DataFrame memiliki tipe data berikut:
- tim :objek
- poin : float64
- memantul : int32
- bantuan : float64
Tipe data ini sesuai dengan yang kami tentukan menggunakan argumen dtype .
Perhatikan bahwa dalam contoh ini kami telah menentukan tipe untuk setiap kolom di DataFrame.
Namun, Anda dapat memilih untuk menentukan jenis kolom tertentu saja dan membiarkan panda menyimpulkan jenis kolom lainnya.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_excel() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Pandas: Cara melewati baris saat membaca file Excel
Pandas: Cara menggabungkan beberapa lembar Excel
Pandas: Cara menulis DataFrames di beberapa lembar Excel