Pandy: jak czytać tylko określone linie z pliku csv


Możesz użyć następującej podstawowej składni, aby wczytać tylko określone wiersze z pliku CSV do ramki DataFrame pandy:

 #specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)

W tym konkretnym przykładzie wiersze o pozycjach indeksu 0, 2 i 3 zostaną odczytane z pliku CSV o nazwie my_data.csv do ramki DataFrame pandy.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Czytaj tylko określone linie z pliku CSV w Pandach

Załóżmy, że mamy następujący plik CSV o nazwie koszykówka_data.csv :

Jeśli użyjemy funkcji read_csv() , pandy automatycznie zaimportują każdą linię pliku CSV do ramki DataFrame:

 import pandas as pd

#import all rows of CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ')

#view DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2

Możemy jednak użyć następującej składni, aby zaimportować tylko wiersze o pozycjach indeksu 0, 2 i 3 z pliku CSV do ramki DataFrame pandy:

 import pandas as pd

#specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows)

#view DataFrame
print (df)

  team points rebounds
0 B 14 9
1 C 29 6

Należy pamiętać, że do ramki DataFrame importowane są tylko wiersze o pozycjach indeksu 0, 2 i 3 pliku CSV.

Ta składnia wykorzystuje argument skiprows i funkcję lambda , aby poinformować pandy, które linie nie powinny zostać pominięte podczas importowania pliku CSV.

W tym przykładzie mówimy pandom, aby nie ignorowały wierszy w pozycjach indeksu 0, 2 i 3, ale aby ignorowały wszystkie inne wiersze podczas importowania pliku CSV.

Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:

Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: Jak określić typy podczas importowania pliku CSV
Pandy: Jak ustawić nazwy kolumn podczas importowania pliku CSV

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *