Pandas: установіть назви стовпців під час імпорту файлу csv
Ви можете використовувати такий базовий синтаксис, щоб визначити імена стовпців DataFrame під час імпорту файлу CSV у pandas:
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_csv (' my_data.csv ', names=colnames)
Аргумент імен приймає список імен, які ви хочете використовувати для стовпців у DataFrame.
Використовуючи цей аргумент, ви також повідомляєте pandas використовувати перший рядок файлу CSV як перший рядок DataFrame замість використання його як рядка заголовка.
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: установіть назви стовпців під час імпортування файлу CSV у Pandas
Скажімо, у нас є такий файл CSV під назвою Players_data.csv :
З файлу ми бачимо, що перший рядок не містить імен стовпців.
Якщо ми імпортуємо файл CSV за допомогою функції read_csv() , pandas спробує використати значення в першому рядку як назви стовпців для DataFrame:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
Однак ми можемо використовувати аргумент імен , щоб указати власні назви стовпців під час імпорту файлу CSV:
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import CSV file and use specified column names df = pd. read_csv (' players_data.csv ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Зауважте, що перший рядок файлу CSV більше не використовується як рядок заголовка.
Натомість імена стовпців, які ми вказали за допомогою аргументу names , тепер використовуються як імена стовпців.
Примітка : Ви можете знайти повну документацію функції pandas read_csv() тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в Python:
Pandas: як пропускати рядки під час читання файлу CSV
Pandas: Як додати дані до наявного файлу CSV
Pandas: як використовувати read_csv з аргументом usecols