Pandy: jak pominąć linie podczas czytania pliku csv


Możesz użyć następujących metod, aby pominąć wiersze podczas odczytu pliku CSV do ramki DataFrame pandy:

Metoda 1: Pomiń określony wiersz

 #import DataFrame and skip 2nd row
df = pd. read_csv ('my_data.csv', skiprows=[ 2 ])

Metoda 2: Ignorowanie wielu określonych wierszy

 #import DataFrame and skip 2nd and 4th row
df = pd. read_csv (' my_data.csv', skiprows=[2,4 ] )

Metoda 3: zignoruj pierwsze N linii

 #import DataFrame and skip first 2 rows
df = pd. read_csv ('my_data.csv', skiprows= 2 )

Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującym plikiem CSV o nazwie koszykówka_data.csv :

Przykład 1: Zignoruj określony wiersz

Możemy użyć poniższego kodu, aby zaimportować plik CSV i zignorować drugą linię:

 import pandas as pd

#import DataFrame and skip 2nd row
df = pd. read_csv ('basketball_data.csv', skiprows=[ 2 ])

#view DataFrame
df

        team points rebounds
0 to 22 10
1 C 29 6
2 D 30 2

Należy zauważyć, że druga linia (z zespołem „B”) została zignorowana podczas importowania pliku CSV do ramki DataFrame pand.

Uwaga : Pierwsza linia pliku CSV jest uważana za linię 0.

Przykład 2: Ignorowanie wielu określonych linii

Możemy użyć poniższego kodu, aby zaimportować plik CSV i pominąć drugą i czwartą linię:

 import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd. read_csv ('basketball_data.csv', skiprows=[ 2 , 4 ])

#view DataFrame
df

        team points rebounds
0 to 22 10
1 C 29 6

Należy zauważyć, że druga i czwarta linia (z zespołami „B” i „D”) zostały zignorowane podczas importowania pliku CSV do ramki DataFrame pand.

Przykład 3: zignoruj pierwsze N linii

Możemy użyć poniższego kodu, aby zaimportować plik CSV i pominąć dwie pierwsze linie:

 import pandas as pd

#import DataFrame and skip first 2 rows
df = pd. read_csv ('basketball_data.csv', skiprows= 2 )

#view DataFrame
df

        B 14 9
0 C 29 6
1 D 30 2

Należy pamiętać, że pierwsze dwie linie pliku CSV zostały pominięte, a następna dostępna linia (z zespołem „B”) stała się linią nagłówka ramki DataFrame.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:

Jak czytać pliki Excel za pomocą Pand
Jak wyeksportować ramkę danych Pandas do programu Excel
Jak wyeksportować tablicę NumPy do pliku CSV

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *