Pandas: как пропускать строки при чтении файла csv


Вы можете использовать следующие методы для пропуска строк при чтении CSV-файла в DataFrame pandas:

Способ 1: пропустить определенную строку

 #import DataFrame and skip 2nd row
df = pd. read_csv ('my_data.csv', skiprows=[ 2 ])

Метод 2: игнорирование нескольких определенных строк

 #import DataFrame and skip 2nd and 4th row
df = pd. read_csv (' my_data.csv', skiprows=[2,4 ] )

Способ 3: игнорировать первые N строк

 #import DataFrame and skip first 2 rows
df = pd. read_csv ('my_data.csv', skiprows= 2 )

В следующих примерах показано, как использовать каждый метод на практике со следующим CSV-файлом с именем баскетбол_данные.csv :

Пример 1. Игнорировать определенную строку

Мы можем использовать следующий код для импорта файла CSV и игнорировать вторую строку:

 import pandas as pd

#import DataFrame and skip 2nd row
df = pd. read_csv ('basketball_data.csv', skiprows=[ 2 ])

#view DataFrame
df

        team points rebounds
0 to 22 10
1 C 29 6
2 D 30 2

Обратите внимание, что вторая строка (с командой «B») была проигнорирована при импорте файла CSV в DataFrame pandas.

Примечание . Первая строка файла CSV считается строкой 0.

Пример 2: Игнорирование нескольких определенных строк

Мы можем использовать следующий код для импорта файла CSV и пропустить вторую и четвертую строки:

 import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd. read_csv ('basketball_data.csv', skiprows=[ 2 , 4 ])

#view DataFrame
df

        team points rebounds
0 to 22 10
1 C 29 6

Обратите внимание, что вторая и четвертая строки (с командами «B» и «D») были проигнорированы при импорте CSV-файла в DataFrame pandas.

Пример 3: игнорировать первые N строк

Мы можем использовать следующий код для импорта файла CSV и пропустить первые две строки:

 import pandas as pd

#import DataFrame and skip first 2 rows
df = pd. read_csv ('basketball_data.csv', skiprows= 2 )

#view DataFrame
df

        B 14 9
0 C 29 6
1 D 30 2

Обратите внимание, что первые две строки файла CSV были пропущены, а следующая доступная строка (с командой «B») стала строкой заголовка DataFrame.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи на Python:

Как читать файлы Excel с помощью Pandas
Как экспортировать DataFrame Pandas в Excel
Как экспортировать массив NumPy в файл CSV

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *