Как читать csv без заголовков в pandas (с примером)
Вы можете использовать следующий базовый синтаксис для чтения CSV-файла без заголовков в DataFrame pandas:
df = pd. read_csv (' my_data.csv ', header= None )
Аргумент header=None сообщает pandas, что первая строка не должна использоваться в качестве строки заголовка.
В следующем примере показано, как использовать этот синтаксис на практике.
Пример: чтение CSV-файла без заголовков в Pandas
Допустим, у нас есть следующий CSV-файл с именем Players_data.csv :
Из файла мы видим, что первая строка не содержит имен столбцов.
Если мы импортируем CSV-файл с помощью функции read_csv() , pandas попытается использовать первую строку в качестве строки заголовка:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
Однако мы можем указать header=None , чтобы pandas не использовала первую строку в качестве строки заголовка:
import pandas as pd #import CSV file without header df = pd. read_csv (' players_data.csv ', header = None ) #view resulting DataFrame print (df) 0 1 2 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Обратите внимание, что первая строка файла CSV больше не используется в качестве строки заголовка.
Также обратите внимание, что pandas по умолчанию использует диапазон числовых значений (0, 1, 2) в качестве имен столбцов.
Чтобы указать собственные имена столбцов при импорте файла CSV, вы можете использовать аргумент имен следующим образом:
import pandas as pd #specify column names cols = [' team ', ' points ', ' rebounds '] #import CSV file without header and specify column names df = pd. read_csv (' players_data.csv ', header = None , names=cols) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
DataFrame теперь имеет имена столбцов, которые мы указали с помощью аргумента имен .
Примечание . Полную документацию по функции pandas read_csv() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи на Python:
Pandas: как пропускать строки при чтении файла CSV
Pandas: как добавить данные в существующий файл CSV
Pandas: как использовать read_csv с аргументом usecols