Pandas: задайте имена столбцов при импорте файла csv
Вы можете использовать следующий базовый синтаксис для определения имен столбцов DataFrame при импорте файла CSV в pandas:
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_csv (' my_data.csv ', names=colnames)
Аргумент имен принимает список имен, которые вы хотите использовать для столбцов в DataFrame.
Используя этот аргумент, вы также указываете pandas использовать первую строку файла CSV в качестве первой строки DataFrame вместо использования ее в качестве строки заголовка.
В следующем примере показано, как использовать этот синтаксис на практике.
Пример: установка имен столбцов при импорте файла CSV в Pandas
Допустим, у нас есть следующий CSV-файл с именем Players_data.csv :
Из файла мы видим, что первая строка не содержит имен столбцов.
Если мы импортируем CSV-файл с помощью функции read_csv() , pandas попытается использовать значения в первой строке в качестве имен столбцов для DataFrame:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
Однако мы можем использовать аргумент имен , чтобы указать собственные имена столбцов при импорте файла CSV:
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import CSV file and use specified column names df = pd. read_csv (' players_data.csv ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Обратите внимание, что первая строка файла CSV больше не используется в качестве строки заголовка.
Вместо этого имена столбцов, которые мы указали с помощью аргумента имен , теперь используются в качестве имен столбцов.
Примечание . Полную документацию по функции pandas read_csv() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи на Python:
Pandas: как пропускать строки при чтении файла CSV
Pandas: как добавить данные в существующий файл CSV
Pandas: как использовать read_csv с аргументом usecols