Pandy: jak czytać tylko określone linie z pliku csv
Możesz użyć następującej podstawowej składni, aby wczytać tylko określone wiersze z pliku CSV do ramki DataFrame pandy:
#specify rows to import
specific_rows = [ 0 , 2 , 3 ]
#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)
W tym konkretnym przykładzie wiersze o pozycjach indeksu 0, 2 i 3 zostaną odczytane z pliku CSV o nazwie my_data.csv do ramki DataFrame pandy.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Czytaj tylko określone linie z pliku CSV w Pandach
Załóżmy, że mamy następujący plik CSV o nazwie koszykówka_data.csv :
Jeśli użyjemy funkcji read_csv() , pandy automatycznie zaimportują każdą linię pliku CSV do ramki DataFrame:
import pandas as pd #import all rows of CSV into DataFrame df = pd. read_csv (' basketball_data.csv ') #view DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2
Możemy jednak użyć następującej składni, aby zaimportować tylko wiersze o pozycjach indeksu 0, 2 i 3 z pliku CSV do ramki DataFrame pandy:
import pandas as pd #specify rows to import specific_rows = [ 0 , 2 , 3 ] #import specific rows from CSV into DataFrame df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows) #view DataFrame print (df) team points rebounds 0 B 14 9 1 C 29 6
Należy pamiętać, że do ramki DataFrame importowane są tylko wiersze o pozycjach indeksu 0, 2 i 3 pliku CSV.
Ta składnia wykorzystuje argument skiprows i funkcję lambda , aby poinformować pandy, które linie nie powinny zostać pominięte podczas importowania pliku CSV.
W tym przykładzie mówimy pandom, aby nie ignorowały wierszy w pozycjach indeksu 0, 2 i 3, ale aby ignorowały wszystkie inne wiersze podczas importowania pliku CSV.
Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:
Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: Jak określić typy podczas importowania pliku CSV
Pandy: Jak ustawić nazwy kolumn podczas importowania pliku CSV