Pandas: cara menentukan tipe saat mengimpor file csv
Anda dapat menggunakan sintaks dasar berikut untuk menentukan tipe setiap kolom dalam DataFrame saat mengimpor file CSV ke pandas:
df = pd. read_csv (' my_data.csv ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
Argumen dtype menentukan tipe data yang harus dimiliki setiap kolom saat mengimpor file CSV ke dalam pandas DataFrame.
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Tentukan jenis saat mengimpor file CSV ke Pandas
Katakanlah kita memiliki file CSV berikut bernama basket_data.csv :
Jika kita mengimpor file CSV menggunakan fungsi read_csv() , panda akan mencoba mengidentifikasi tipe data untuk setiap kolom secara otomatis:
import pandas as pd #import CSV file df = pd. read_csv (' basketball_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 dtype:object
Dari hasilnya, kita dapat melihat bahwa kolom DataFrame memiliki tipe data berikut:
- tim :objek
- poin : int64
- memantul : int64
Namun, kita bisa menggunakan argumen dtype dalam fungsi read_csv() untuk menentukan tipe data yang harus dimiliki setiap kolom:
import pandas as pd #import CSV file and specify dtype of each column df = pd. read_csv (' basketball_data.csv ', dtype = {' team ': str , ' points ': float , ' rebounds ': int })) #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 dtype:object
Dari hasilnya, kita dapat melihat bahwa kolom DataFrame memiliki tipe data berikut:
- tim :objek
- poin : float64
- memantul : int32
Tipe data ini sesuai dengan yang kami tentukan menggunakan argumen dtype .
Perhatikan bahwa dalam contoh ini kami telah menentukan tipe untuk setiap kolom di DataFrame.
Namun, Anda dapat memilih untuk menentukan jenis kolom tertentu saja dan membiarkan panda menyimpulkan jenis kolom lainnya.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_csv() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Pandas: Cara melewati baris saat membaca file CSV
Pandas: Cara menambahkan data ke file CSV yang sudah ada
Pandas: Cara membaca file CSV tanpa header
Pandas: Cara mengatur nama kolom saat mengimpor file CSV