Pandy: jak określić typy podczas importowania pliku excel
Możesz użyć następującej podstawowej składni, aby określić typ każdej kolumny w ramce DataFrame podczas importowania pliku Excel do pand:
df = pd. read_excel (' my_data.xlsx ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
Argument dtype określa typ danych, jaki powinna mieć każda kolumna podczas importowania pliku Excel do ramki DataFrame pandy.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Określ typy podczas importowania pliku Excel do Pand
Załóżmy, że mamy następujący plik Excela o nazwie player_data.xlsx :
Jeśli zaimportujemy plik Excel za pomocą funkcji read_excel() , pandy spróbują automatycznie zidentyfikować typ danych dla każdej kolumny:
import pandas as pd #import Excel file df = pd. read_excel (' player_data.xlsx ') #view resulting DataFrame print (df) team points rebound assists 0 to 24 8 5 1 B 20 12 3 2 C 15 4 7 3 D 19 4 8 4 E 32 6 8 5 F 13 7 9 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 assists int64 dtype:object
Z wyniku widzimy, że kolumny DataFrame mają następujące typy danych:
- zespół : obiekt
- punkty : int64
- odbija : int64
- asysty : int64
Możemy jednak użyć argumentu dtype w funkcji read_excel() , aby określić typy danych, które powinna mieć każda kolumna:
import pandas as pd #import Excel file and specify dtypes of columns df = pd. read_excel (' player_data.xlsx ', dtype = {' team ': str , ' points ': float , ' rebounds ': int , ' assists ': float }) #view resulting DataFrame print (df) team points rebound assists 0 A 24.0 8 5.0 1 B 20.0 12 3.0 2 C 15.0 4 7.0 3 D 19.0 4 8.0 4 E 32.0 6 8.0 5 F 13.0 7 9.0 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 assist float64 dtype:object
Z wyniku widzimy, że kolumny DataFrame mają następujące typy danych:
- zespół : obiekt
- punkty : float64
- odbija : int32
- asysty : float64
Te typy danych odpowiadają tym, które określiliśmy za pomocą argumentu dtype .
Należy zauważyć, że w tym przykładzie określiliśmy typ każdej kolumny w ramce DataFrame.
Możesz jednak określić typ tylko dla określonych kolumn i pozwolić pandom określić typ dla pozostałych kolumn.
Uwaga : pełną dokumentację funkcji pandy read_excel() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Pandy: Jak pominąć linie podczas czytania pliku Excel
Pandy: Jak połączyć wiele arkuszy Excela
Pandy: Jak pisać ramki danych w wielu arkuszach Excela