Pandas: cara menentukan tipe saat mengimpor file csv


Anda dapat menggunakan sintaks dasar berikut untuk menentukan tipe setiap kolom dalam DataFrame saat mengimpor file CSV ke pandas:

 df = pd. read_csv (' my_data.csv ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Argumen dtype menentukan tipe data yang harus dimiliki setiap kolom saat mengimpor file CSV ke dalam pandas DataFrame.

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Tentukan jenis saat mengimpor file CSV ke Pandas

Katakanlah kita memiliki file CSV berikut bernama basket_data.csv :

Jika kita mengimpor file CSV menggunakan fungsi read_csv() , panda akan mencoba mengidentifikasi tipe data untuk setiap kolom secara otomatis:

 import pandas as pd

#import CSV file
df = pd. read_csv (' basketball_data.csv ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
dtype:object

Dari hasilnya, kita dapat melihat bahwa kolom DataFrame memiliki tipe data berikut:

  • tim :objek
  • poin : int64
  • memantul : int64

Namun, kita bisa menggunakan argumen dtype dalam fungsi read_csv() untuk menentukan tipe data yang harus dimiliki setiap kolom:

import pandas as pd

#import CSV file and specify dtype of each column
df = pd. read_csv (' basketball_data.csv ',
                 dtype = {' team ': str , ' points ': float , ' rebounds ': int }))

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
dtype:object

Dari hasilnya, kita dapat melihat bahwa kolom DataFrame memiliki tipe data berikut:

  • tim :objek
  • poin : float64
  • memantul : int32

Tipe data ini sesuai dengan yang kami tentukan menggunakan argumen dtype .

Perhatikan bahwa dalam contoh ini kami telah menentukan tipe untuk setiap kolom di DataFrame.

Namun, Anda dapat memilih untuk menentukan jenis kolom tertentu saja dan membiarkan panda menyimpulkan jenis kolom lainnya.

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_csv() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Pandas: Cara melewati baris saat membaca file CSV
Pandas: Cara menambahkan data ke file CSV yang sudah ada
Pandas: Cara membaca file CSV tanpa header
Pandas: Cara mengatur nama kolom saat mengimpor file CSV

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *