Pandas: как читать только определенные строки из файла csv


Вы можете использовать следующий базовый синтаксис для чтения только определенных строк из CSV-файла в DataFrame pandas:

 #specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)

В этом конкретном примере строки с позициями индекса 0, 2 и 3 будут считываться из CSV-файла с именем my_data.csv в DataFrame pandas.

В следующем примере показано, как использовать этот синтаксис на практике.

Пример. Чтение только определенных строк из CSV-файла в Pandas.

Допустим, у нас есть следующий CSV-файл с именем Basketball_data.csv :

Если мы используем функцию read_csv() , pandas автоматически импортирует каждую строку CSV-файла в DataFrame:

 import pandas as pd

#import all rows of CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ')

#view DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2

Однако мы можем использовать следующий синтаксис для импорта только строк с позициями индекса 0, 2 и 3 из CSV-файла в DataFrame pandas:

 import pandas as pd

#specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows)

#view DataFrame
print (df)

  team points rebounds
0 B 14 9
1 C 29 6

Обратите внимание, что в DataFrame импортируются только строки с позициями индекса 0, 2 и 3 файла CSV.

Этот синтаксис использует аргумент Skiprows и лямбда -функцию, чтобы сообщить пандам, какие строки не следует пропускать при импорте файла CSV.

В этом примере мы говорим пандам не игнорировать строки в позициях индекса 0, 2 и 3, а игнорировать все остальные строки при импорте файла CSV.

Примечание . Полную документацию по функции pandas read_csv() можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи на Python:

Pandas: как пропускать строки при чтении файла CSV
Pandas: как добавить данные в существующий файл CSV
Pandas: как указать типы при импорте файла CSV
Pandas: как установить имена столбцов при импорте файла CSV

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *