Pandas: как читать только определенные строки из файла csv
Вы можете использовать следующий базовый синтаксис для чтения только определенных строк из CSV-файла в DataFrame pandas:
#specify rows to import
specific_rows = [ 0 , 2 , 3 ]
#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)
В этом конкретном примере строки с позициями индекса 0, 2 и 3 будут считываться из CSV-файла с именем my_data.csv в DataFrame pandas.
В следующем примере показано, как использовать этот синтаксис на практике.
Пример. Чтение только определенных строк из CSV-файла в Pandas.
Допустим, у нас есть следующий CSV-файл с именем Basketball_data.csv :
Если мы используем функцию read_csv() , pandas автоматически импортирует каждую строку CSV-файла в DataFrame:
import pandas as pd #import all rows of CSV into DataFrame df = pd. read_csv (' basketball_data.csv ') #view DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2
Однако мы можем использовать следующий синтаксис для импорта только строк с позициями индекса 0, 2 и 3 из CSV-файла в DataFrame pandas:
import pandas as pd #specify rows to import specific_rows = [ 0 , 2 , 3 ] #import specific rows from CSV into DataFrame df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows) #view DataFrame print (df) team points rebounds 0 B 14 9 1 C 29 6
Обратите внимание, что в DataFrame импортируются только строки с позициями индекса 0, 2 и 3 файла CSV.
Этот синтаксис использует аргумент Skiprows и лямбда -функцию, чтобы сообщить пандам, какие строки не следует пропускать при импорте файла CSV.
В этом примере мы говорим пандам не игнорировать строки в позициях индекса 0, 2 и 3, а игнорировать все остальные строки при импорте файла CSV.
Примечание . Полную документацию по функции pandas read_csv() можно найти здесь .
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи на Python:
Pandas: как пропускать строки при чтении файла CSV
Pandas: как добавить данные в существующий файл CSV
Pandas: как указать типы при импорте файла CSV
Pandas: как установить имена столбцов при импорте файла CSV