Pandas: игнорировать первый столбец при импорте файла csv
Вы можете использовать следующий базовый синтаксис, чтобы игнорировать первый столбец при импорте файла CSV в DataFrame pandas:
with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))
В этом конкретном примере каждый столбец CSV-файла с именем Basketball_data.csv будет считан в DataFrame pandas, за исключением первого столбца.
Используя этот код, мы сначала находим количество столбцов в CSV-файле и присваиваем его переменной ncols .
Далее мы используем аргумент usecols , чтобы указать, что мы хотим импортировать только столбцы между 1 (т. е. вторым столбцом) и последним столбцом файла CSV.
В следующем примере показано, как использовать этот синтаксис на практике.
Пример. Игнорируйте первый столбец при импорте файла CSV в Pandas.
Допустим, у нас есть следующий CSV-файл с именем Basketball_data.csv :
Мы можем использовать следующий синтаксис для импорта CSV-файла в DataFrame pandas и игнорировать первый столбец:
import pandas as pd #calculate number of columns in CSV file with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Обратите внимание, что первый столбец с названием «Команда» был удален, когда мы импортировали файл CSV в pandas.
Обратите внимание: если вы заранее знаете общее количество столбцов в CSV-файле, вы можете напрямую передать это значение в аргумент usecols .
Например, предположим, что мы уже знаем, что в файле CVS есть три столбца.
Мы могли бы использовать следующий синтаксис для импорта CSV-файла в DataFrame pandas и игнорировать первый столбец:
import pandas as pd #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Обратите внимание, что первый столбец с названием «Команда» был удален, когда мы импортировали файл CSV в pandas.
Поскольку мы уже знали, что в файле CSV есть три столбца, мы просто использовали диапазон (1,3) в аргументе usecols .
Примечание . Полную документацию по функции pandas read_csv() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи на Python:
Pandas: как пропускать строки при чтении файла CSV
Pandas: как добавить данные в существующий файл CSV
Pandas: как использовать read_csv с аргументом usecols