Pandas: як читати лише певні рядки з файлу csv
Ви можете використовувати наступний базовий синтаксис, щоб читати лише певні рядки з файлу CSV у pandas DataFrame:
#specify rows to import
specific_rows = [ 0 , 2 , 3 ]
#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)
У цьому конкретному прикладі зчитуються рядки в позиціях індексу 0, 2 і 3 з файлу CSV під назвою my_data.csv у DataFrame pandas.
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: читайте лише певні рядки з файлу CSV у Pandas
Скажімо, у нас є такий файл CSV під назвою basketball_data.csv :
Якщо ми використовуємо функцію read_csv() , pandas автоматично імпортує кожен рядок файлу CSV у DataFrame:
import pandas as pd #import all rows of CSV into DataFrame df = pd. read_csv (' basketball_data.csv ') #view DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2
Однак ми можемо використати наступний синтаксис, щоб імпортувати лише рядки в індексних позиціях 0, 2 і 3 з файлу CSV у pandas DataFrame:
import pandas as pd #specify rows to import specific_rows = [ 0 , 2 , 3 ] #import specific rows from CSV into DataFrame df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows) #view DataFrame print (df) team points rebounds 0 B 14 9 1 C 29 6
Зауважте, що в DataFrame імпортуються лише рядки в індексних позиціях 0, 2 і 3 файлу CSV.
Цей синтаксис використовує аргумент skiprows і функцію лямбда , щоб повідомити pandas, які рядки не слід пропускати під час імпортування файлу CSV.
У цьому прикладі ми повідомляємо pandas не ігнорувати рядки в позиціях індексу 0, 2 і 3, але ігнорувати всі інші рядки під час імпорту файлу CSV.
Примітка : Ви можете знайти повну документацію функції pandas read_csv() тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в Python:
Pandas: як пропускати рядки під час читання файлу CSV
Pandas: Як додати дані до наявного файлу CSV
Pandas: як указати типи під час імпортування файлу CSV
Pandas: Як встановити назви стовпців під час імпорту файлу CSV