Pandy: jak określić typy podczas importowania pliku excel


Możesz użyć następującej podstawowej składni, aby określić typ każdej kolumny w ramce DataFrame podczas importowania pliku Excel do pand:

 df = pd. read_excel (' my_data.xlsx ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Argument dtype określa typ danych, jaki powinna mieć każda kolumna podczas importowania pliku Excel do ramki DataFrame pandy.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Określ typy podczas importowania pliku Excel do Pand

Załóżmy, że mamy następujący plik Excela o nazwie player_data.xlsx :

Jeśli zaimportujemy plik Excel za pomocą funkcji read_excel() , pandy spróbują automatycznie zidentyfikować typ danych dla każdej kolumny:

 import pandas as pd

#import Excel file
df = pd. read_excel (' player_data.xlsx ')

#view resulting DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 B 20 12 3
2 C 15 4 7
3 D 19 4 8
4 E 32 6 8
5 F 13 7 9

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
assists int64
dtype:object

Z wyniku widzimy, że kolumny DataFrame mają następujące typy danych:

  • zespół : obiekt
  • punkty : int64
  • odbija : int64
  • asysty : int64

Możemy jednak użyć argumentu dtype w funkcji read_excel() , aby określić typy danych, które powinna mieć każda kolumna:

import pandas as pd

#import Excel file and specify dtypes of columns
df = pd. read_excel (' player_data.xlsx ',
                   dtype = {' team ': str , ' points ': float , ' rebounds ': int ,
                            ' assists ': float })

#view resulting DataFrame
print (df)

  team points rebound assists
0 A 24.0 8 5.0
1 B 20.0 12 3.0
2 C 15.0 4 7.0
3 D 19.0 4 8.0
4 E 32.0 6 8.0
5 F 13.0 7 9.0

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
assist float64
dtype:object

Z wyniku widzimy, że kolumny DataFrame mają następujące typy danych:

  • zespół : obiekt
  • punkty : float64
  • odbija : int32
  • asysty : float64

Te typy danych odpowiadają tym, które określiliśmy za pomocą argumentu dtype .

Należy zauważyć, że w tym przykładzie określiliśmy typ każdej kolumny w ramce DataFrame.

Możesz jednak określić typ tylko dla określonych kolumn i pozwolić pandom określić typ dla pozostałych kolumn.

Uwaga : pełną dokumentację funkcji pandy read_excel() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: Jak pominąć linie podczas czytania pliku Excel
Pandy: Jak połączyć wiele arkuszy Excela
Pandy: Jak pisać ramki danych w wielu arkuszach Excela

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *