Pandas: игнорировать первый столбец при импорте файла csv


Вы можете использовать следующий базовый синтаксис, чтобы игнорировать первый столбец при импорте файла CSV в DataFrame pandas:

 with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

В этом конкретном примере каждый столбец CSV-файла с именем Basketball_data.csv будет считан в DataFrame pandas, за исключением первого столбца.

Используя этот код, мы сначала находим количество столбцов в CSV-файле и присваиваем его переменной ncols .

Далее мы используем аргумент usecols , чтобы указать, что мы хотим импортировать только столбцы между 1 (т. е. вторым столбцом) и последним столбцом файла CSV.

В следующем примере показано, как использовать этот синтаксис на практике.

Пример. Игнорируйте первый столбец при импорте файла CSV в Pandas.

Допустим, у нас есть следующий CSV-файл с именем Basketball_data.csv :

Мы можем использовать следующий синтаксис для импорта CSV-файла в DataFrame pandas и игнорировать первый столбец:

 import pandas as pd

#calculate number of columns in CSV file
with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Обратите внимание, что первый столбец с названием «Команда» был удален, когда мы импортировали файл CSV в pandas.

Обратите внимание: если вы заранее знаете общее количество столбцов в CSV-файле, вы можете напрямую передать это значение в аргумент usecols .

Например, предположим, что мы уже знаем, что в файле CVS есть три столбца.

Мы могли бы использовать следующий синтаксис для импорта CSV-файла в DataFrame pandas и игнорировать первый столбец:

 import pandas as pd

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Обратите внимание, что первый столбец с названием «Команда» был удален, когда мы импортировали файл CSV в pandas.

Поскольку мы уже знали, что в файле CSV есть три столбца, мы просто использовали диапазон (1,3) в аргументе usecols .

Примечание . Полную документацию по функции pandas read_csv() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи на Python:

Pandas: как пропускать строки при чтении файла CSV
Pandas: как добавить данные в существующий файл CSV
Pandas: как использовать read_csv с аргументом usecols

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *