Pandy: jak określić typy podczas importowania pliku csv
Możesz użyć następującej podstawowej składni, aby określić typ każdej kolumny w ramce DataFrame podczas importowania pliku CSV do pand:
df = pd. read_csv (' my_data.csv ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
Argument dtype określa typ danych, jaki powinna mieć każda kolumna podczas importowania pliku CSV do ramki DataFrame pandy.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Określ typy podczas importowania pliku CSV do Pand
Załóżmy, że mamy następujący plik CSV o nazwie koszykówka_data.csv :
Jeśli zaimportujemy plik CSV za pomocą funkcji read_csv() , pandy spróbują automatycznie zidentyfikować typ danych dla każdej kolumny:
import pandas as pd #import CSV file df = pd. read_csv (' basketball_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 dtype:object
Z wyniku widzimy, że kolumny DataFrame mają następujące typy danych:
- zespół : obiekt
- punkty : int64
- odbija : int64
Możemy jednak użyć argumentu dtype w funkcji read_csv() , aby określić typy danych, które powinna mieć każda kolumna:
import pandas as pd #import CSV file and specify dtype of each column df = pd. read_csv (' basketball_data.csv ', dtype = {' team ': str , ' points ': float , ' rebounds ': int })) #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 dtype:object
Z wyniku widzimy, że kolumny DataFrame mają następujące typy danych:
- zespół : obiekt
- punkty : float64
- odbija : int32
Te typy danych odpowiadają tym, które określiliśmy za pomocą argumentu dtype .
Należy zauważyć, że w tym przykładzie określiliśmy typ każdej kolumny w ramce DataFrame.
Możesz jednak określić typ tylko dla określonych kolumn i pozwolić pandom określić typ dla pozostałych kolumn.
Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: Jak odczytać plik CSV bez nagłówków
Pandy: Jak ustawić nazwy kolumn podczas importowania pliku CSV