Pandas: як указати типи під час імпорту файлу csv


Ви можете використовувати наступний базовий синтаксис, щоб указати тип кожного стовпця в DataFrame під час імпорту файлу CSV у pandas:

 df = pd. read_csv (' my_data.csv ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Аргумент dtype визначає тип даних, який повинен мати кожен стовпець під час імпорту файлу CSV у DataFrame pandas.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: укажіть типи під час імпорту файлу CSV у Pandas

Скажімо, у нас є такий файл CSV під назвою basketball_data.csv :

Якщо ми імпортуємо файл CSV за допомогою функції read_csv() , pandas спробує автоматично визначити тип даних для кожного стовпця:

 import pandas as pd

#import CSV file
df = pd. read_csv (' basketball_data.csv ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
dtype:object

З результату ми бачимо, що стовпці DataFrame мають такі типи даних:

  • команда : об’єкт
  • бали : int64
  • відскоки : int64

Однак ми можемо використовувати аргумент dtype у функції read_csv() , щоб вказати типи даних, які має мати кожен стовпець:

import pandas as pd

#import CSV file and specify dtype of each column
df = pd. read_csv (' basketball_data.csv ',
                 dtype = {' team ': str , ' points ': float , ' rebounds ': int }))

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
dtype:object

З результату ми бачимо, що стовпці DataFrame мають такі типи даних:

  • команда : об’єкт
  • точки : float64
  • відскоки : int32

Ці типи даних відповідають тим, які ми вказали за допомогою аргументу dtype .

Зверніть увагу, що в цьому прикладі ми вказали тип для кожного стовпця в DataFrame.

Однак ви можете вказати тип лише для певних стовпців і дозволити pandas визначити тип для решти стовпців.

Примітка : Ви можете знайти повну документацію функції pandas read_csv() тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Pandas: як пропускати рядки під час читання файлу CSV
Pandas: Як додати дані до наявного файлу CSV
Pandas: як читати файл CSV без заголовків
Pandas: Як встановити назви стовпців під час імпорту файлу CSV

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *