Pandalar: bir excel dosyasını içe aktarırken türler nasıl belirtilir?
Bir Excel dosyasını pandalara aktarırken DataFrame’deki her sütunun türünü belirtmek için aşağıdaki temel sözdizimini kullanabilirsiniz:
df = pd. read_excel (' my_data.xlsx ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
Dtype bağımsız değişkeni, Excel dosyasını bir pandas DataFrame’e aktarırken her sütunun sahip olması gereken veri türünü belirtir.
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: Bir Excel Dosyasını Pandas’a Aktarırken Türleri Belirleme
Diyelim ki player_data.xlsx adında aşağıdaki Excel dosyamız var:
Excel dosyasını read_excel() işlevini kullanarak içe aktarırsak, pandalar her sütun için veri türünü otomatik olarak tanımlamaya çalışacaktır:
import pandas as pd #import Excel file df = pd. read_excel (' player_data.xlsx ') #view resulting DataFrame print (df) team points rebound assists 0 to 24 8 5 1 B 20 12 3 2 C 15 4 7 3 D 19 4 8 4 E 32 6 8 5 F 13 7 9 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 assists int64 dtype:object
Sonuçta DataFrame’in sütunlarının aşağıdaki veri türlerine sahip olduğunu görebiliriz:
- takım : nesne
- puan : int64
- geri dönenler : int64
- asist : int64
Ancak her sütunun sahip olması gereken veri türlerini belirtmek için read_excel() işlevindeki dtype argümanını kullanabiliriz:
import pandas as pd #import Excel file and specify dtypes of columns df = pd. read_excel (' player_data.xlsx ', dtype = {' team ': str , ' points ': float , ' rebounds ': int , ' assists ': float }) #view resulting DataFrame print (df) team points rebound assists 0 A 24.0 8 5.0 1 B 20.0 12 3.0 2 C 15.0 4 7.0 3 D 19.0 4 8.0 4 E 32.0 6 8.0 5 F 13.0 7 9.0 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 assist float64 dtype:object
Sonuçta DataFrame’in sütunlarının aşağıdaki veri türlerine sahip olduğunu görebiliriz:
- takım : nesne
- puan : float64
- geri dönenler : int32
- Asist : float64
Bu veri türleri dtype argümanını kullanarak belirttiklerimize karşılık gelir.
Bu örnekte DataFrame’deki her sütunun türünü belirttiğimizi unutmayın.
Ancak, yalnızca belirli sütunlar için tür belirlemeyi seçebilir ve pandaların kalan sütunlar için tür çıkarımına izin verebilirsiniz.
Not : Pandaların read_excel() işlevinin tam belgelerini burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalar: Bir Excel dosyasını okurken satırlar nasıl atlanır
Pandalar: Birden fazla Excel sayfası nasıl birleştirilir
Pandalar: Birden fazla Excel sayfasına DataFrame’ler nasıl yazılır?