Pandas: cara menentukan tipe saat mengimpor file excel


Anda dapat menggunakan sintaks dasar berikut untuk menentukan tipe setiap kolom dalam DataFrame saat mengimpor file Excel ke pandas:

 df = pd. read_excel (' my_data.xlsx ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Argumen dtype menentukan tipe data yang harus dimiliki setiap kolom saat mengimpor file Excel ke dalam pandas DataFrame.

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Tentukan Jenis Saat Mengimpor File Excel ke Pandas

Katakanlah kita memiliki file Excel berikut bernama player_data.xlsx :

Jika kita mengimpor file Excel menggunakan fungsi read_excel() , panda akan mencoba mengidentifikasi tipe data untuk setiap kolom secara otomatis:

 import pandas as pd

#import Excel file
df = pd. read_excel (' player_data.xlsx ')

#view resulting DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 B 20 12 3
2 C 15 4 7
3 D 19 4 8
4 E 32 6 8
5 F 13 7 9

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
assists int64
dtype:object

Dari hasilnya, kita dapat melihat bahwa kolom DataFrame memiliki tipe data berikut:

  • tim :objek
  • poin : int64
  • memantul : int64
  • bantuan : int64

Namun, kita bisa menggunakan argumen dtype dalam fungsi read_excel() untuk menentukan tipe data yang harus dimiliki setiap kolom:

import pandas as pd

#import Excel file and specify dtypes of columns
df = pd. read_excel (' player_data.xlsx ',
                   dtype = {' team ': str , ' points ': float , ' rebounds ': int ,
                            ' assists ': float })

#view resulting DataFrame
print (df)

  team points rebound assists
0 A 24.0 8 5.0
1 B 20.0 12 3.0
2 C 15.0 4 7.0
3 D 19.0 4 8.0
4 E 32.0 6 8.0
5 F 13.0 7 9.0

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
assist float64
dtype:object

Dari hasilnya, kita dapat melihat bahwa kolom DataFrame memiliki tipe data berikut:

  • tim :objek
  • poin : float64
  • memantul : int32
  • bantuan : float64

Tipe data ini sesuai dengan yang kami tentukan menggunakan argumen dtype .

Perhatikan bahwa dalam contoh ini kami telah menentukan tipe untuk setiap kolom di DataFrame.

Namun, Anda dapat memilih untuk menentukan jenis kolom tertentu saja dan membiarkan panda menyimpulkan jenis kolom lainnya.

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_excel() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Pandas: Cara melewati baris saat membaca file Excel
Pandas: Cara menggabungkan beberapa lembar Excel
Pandas: Cara menulis DataFrames di beberapa lembar Excel

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *