Pandalar: bir excel dosyasını içe aktarırken türler nasıl belirtilir?


Bir Excel dosyasını pandalara aktarırken DataFrame’deki her sütunun türünü belirtmek için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df = pd. read_excel (' my_data.xlsx ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Dtype bağımsız değişkeni, Excel dosyasını bir pandas DataFrame’e aktarırken her sütunun sahip olması gereken veri türünü belirtir.

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: Bir Excel Dosyasını Pandas’a Aktarırken Türleri Belirleme

Diyelim ki player_data.xlsx adında aşağıdaki Excel dosyamız var:

Excel dosyasını read_excel() işlevini kullanarak içe aktarırsak, pandalar her sütun için veri türünü otomatik olarak tanımlamaya çalışacaktır:

 import pandas as pd

#import Excel file
df = pd. read_excel (' player_data.xlsx ')

#view resulting DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 B 20 12 3
2 C 15 4 7
3 D 19 4 8
4 E 32 6 8
5 F 13 7 9

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
assists int64
dtype:object

Sonuçta DataFrame’in sütunlarının aşağıdaki veri türlerine sahip olduğunu görebiliriz:

  • takım : nesne
  • puan : int64
  • geri dönenler : int64
  • asist : int64

Ancak her sütunun sahip olması gereken veri türlerini belirtmek için read_excel() işlevindeki dtype argümanını kullanabiliriz:

import pandas as pd

#import Excel file and specify dtypes of columns
df = pd. read_excel (' player_data.xlsx ',
                   dtype = {' team ': str , ' points ': float , ' rebounds ': int ,
                            ' assists ': float })

#view resulting DataFrame
print (df)

  team points rebound assists
0 A 24.0 8 5.0
1 B 20.0 12 3.0
2 C 15.0 4 7.0
3 D 19.0 4 8.0
4 E 32.0 6 8.0
5 F 13.0 7 9.0

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
assist float64
dtype:object

Sonuçta DataFrame’in sütunlarının aşağıdaki veri türlerine sahip olduğunu görebiliriz:

  • takım : nesne
  • puan : float64
  • geri dönenler : int32
  • Asist : float64

Bu veri türleri dtype argümanını kullanarak belirttiklerimize karşılık gelir.

Bu örnekte DataFrame’deki her sütunun türünü belirttiğimizi unutmayın.

Ancak, yalnızca belirli sütunlar için tür belirlemeyi seçebilir ve pandaların kalan sütunlar için tür çıkarımına izin verebilirsiniz.

Not : Pandaların read_excel() işlevinin tam belgelerini burada bulabilirsiniz.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalar: Bir Excel dosyasını okurken satırlar nasıl atlanır
Pandalar: Birden fazla Excel sayfası nasıl birleştirilir
Pandalar: Birden fazla Excel sayfasına DataFrame’ler nasıl yazılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir