Pandy: jak określić typy podczas importowania pliku csv


Możesz użyć następującej podstawowej składni, aby określić typ każdej kolumny w ramce DataFrame podczas importowania pliku CSV do pand:

 df = pd. read_csv (' my_data.csv ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Argument dtype określa typ danych, jaki powinna mieć każda kolumna podczas importowania pliku CSV do ramki DataFrame pandy.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Określ typy podczas importowania pliku CSV do Pand

Załóżmy, że mamy następujący plik CSV o nazwie koszykówka_data.csv :

Jeśli zaimportujemy plik CSV za pomocą funkcji read_csv() , pandy spróbują automatycznie zidentyfikować typ danych dla każdej kolumny:

 import pandas as pd

#import CSV file
df = pd. read_csv (' basketball_data.csv ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
dtype:object

Z wyniku widzimy, że kolumny DataFrame mają następujące typy danych:

  • zespół : obiekt
  • punkty : int64
  • odbija : int64

Możemy jednak użyć argumentu dtype w funkcji read_csv() , aby określić typy danych, które powinna mieć każda kolumna:

import pandas as pd

#import CSV file and specify dtype of each column
df = pd. read_csv (' basketball_data.csv ',
                 dtype = {' team ': str , ' points ': float , ' rebounds ': int }))

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
dtype:object

Z wyniku widzimy, że kolumny DataFrame mają następujące typy danych:

  • zespół : obiekt
  • punkty : float64
  • odbija : int32

Te typy danych odpowiadają tym, które określiliśmy za pomocą argumentu dtype .

Należy zauważyć, że w tym przykładzie określiliśmy typ każdej kolumny w ramce DataFrame.

Możesz jednak określić typ tylko dla określonych kolumn i pozwolić pandom określić typ dla pozostałych kolumn.

Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: Jak odczytać plik CSV bez nagłówków
Pandy: Jak ustawić nazwy kolumn podczas importowania pliku CSV

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *