Pandas: як указати типи під час імпорту файлу csv
Ви можете використовувати наступний базовий синтаксис, щоб указати тип кожного стовпця в DataFrame під час імпорту файлу CSV у pandas:
df = pd. read_csv (' my_data.csv ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
Аргумент dtype визначає тип даних, який повинен мати кожен стовпець під час імпорту файлу CSV у DataFrame pandas.
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: укажіть типи під час імпорту файлу CSV у Pandas
Скажімо, у нас є такий файл CSV під назвою basketball_data.csv :
Якщо ми імпортуємо файл CSV за допомогою функції read_csv() , pandas спробує автоматично визначити тип даних для кожного стовпця:
import pandas as pd #import CSV file df = pd. read_csv (' basketball_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 dtype:object
З результату ми бачимо, що стовпці DataFrame мають такі типи даних:
- команда : об’єкт
- бали : int64
- відскоки : int64
Однак ми можемо використовувати аргумент dtype у функції read_csv() , щоб вказати типи даних, які має мати кожен стовпець:
import pandas as pd #import CSV file and specify dtype of each column df = pd. read_csv (' basketball_data.csv ', dtype = {' team ': str , ' points ': float , ' rebounds ': int })) #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 dtype:object
З результату ми бачимо, що стовпці DataFrame мають такі типи даних:
- команда : об’єкт
- точки : float64
- відскоки : int32
Ці типи даних відповідають тим, які ми вказали за допомогою аргументу dtype .
Зверніть увагу, що в цьому прикладі ми вказали тип для кожного стовпця в DataFrame.
Однак ви можете вказати тип лише для певних стовпців і дозволити pandas визначити тип для решти стовпців.
Примітка : Ви можете знайти повну документацію функції pandas read_csv() тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:
Pandas: як пропускати рядки під час читання файлу CSV
Pandas: Як додати дані до наявного файлу CSV
Pandas: як читати файл CSV без заголовків
Pandas: Як встановити назви стовпців під час імпорту файлу CSV