Pandas: як читати лише певні рядки з файлу csv


Ви можете використовувати наступний базовий синтаксис, щоб читати лише певні рядки з файлу CSV у pandas DataFrame:

 #specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)

У цьому конкретному прикладі зчитуються рядки в позиціях індексу 0, 2 і 3 з файлу CSV під назвою my_data.csv у DataFrame pandas.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: читайте лише певні рядки з файлу CSV у Pandas

Скажімо, у нас є такий файл CSV під назвою basketball_data.csv :

Якщо ми використовуємо функцію read_csv() , pandas автоматично імпортує кожен рядок файлу CSV у DataFrame:

 import pandas as pd

#import all rows of CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ')

#view DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2

Однак ми можемо використати наступний синтаксис, щоб імпортувати лише рядки в індексних позиціях 0, 2 і 3 з файлу CSV у pandas DataFrame:

 import pandas as pd

#specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows)

#view DataFrame
print (df)

  team points rebounds
0 B 14 9
1 C 29 6

Зауважте, що в DataFrame імпортуються лише рядки в індексних позиціях 0, 2 і 3 файлу CSV.

Цей синтаксис використовує аргумент skiprows і функцію лямбда , щоб повідомити pandas, які рядки не слід пропускати під час імпортування файлу CSV.

У цьому прикладі ми повідомляємо pandas не ігнорувати рядки в позиціях індексу 0, 2 і 3, але ігнорувати всі інші рядки під час імпорту файлу CSV.

Примітка : Ви можете знайти повну документацію функції pandas read_csv() тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в Python:

Pandas: як пропускати рядки під час читання файлу CSV
Pandas: Як додати дані до наявного файлу CSV
Pandas: як указати типи під час імпортування файлу CSV
Pandas: Як встановити назви стовпців під час імпорту файлу CSV

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *