Pandas: so überspringen sie zeilen beim lesen einer excel-datei


Sie können die folgenden Methoden verwenden, um Zeilen zu überspringen, wenn Sie eine Excel-Datei in einen Pandas-DataFrame einlesen:

Methode 1: Eine bestimmte Zeile überspringen

 #import DataFrame and skip row in index position 2
df = pd. read_excel (' my_data.xlsx ', skiprows=[ 2 ])

Methode 2: Ignorieren mehrerer spezifischer Zeilen

 #import DataFrame and skip rows in index positions 2 and 4
df = pd. read_excel (' my_data.xlsx ' , skiprows=[2,4 ] )

Methode 3: Ignorieren Sie die ersten N Zeilen

 #import DataFrame and skip first 2 rows
df = pd. read_excel (' my_data.xlsx ', skiprows= 2 )

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit der folgenden Excel-Datei namens player_data.xlsx verwendet wird:

Beispiel 1: Eine bestimmte Zeile ignorieren

Wir können den folgenden Code verwenden, um die Excel-Datei zu importieren und die Zeile an Indexposition 2 zu ignorieren:

 import pandas as pd

#import DataFrame and skip row in index position 2
df = pd. read_excel (' player_data.xlsx ', skiprows=[ 2 ])

#view DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 C 15 4 7
2 D 19 4 8
3 E 32 6 8
4 F 13 7 9

Beachten Sie, dass die Zeile an Indexposition 2 (mit Team „B“) beim Importieren der Excel-Datei in den Pandas DataFrame ignoriert wurde.

Hinweis : Die erste Zeile der Excel-Datei wird als Zeile 0 betrachtet.

Beispiel 2: Ignorieren mehrerer spezifischer Zeilen

Mit dem folgenden Code können wir die Excel-Datei importieren und die Zeilen an den Indexpositionen 2 und 4 ignorieren:

 import pandas as pd

#import DataFrame and skip rows in index positions 2 and 4
df = pd. read_excel (' player_data.xlsx ', skiprows=[ 2,4 ] )

#view DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 C 15 4 7
2 E 32 6 8
3 F 13 7 9

Beachten Sie, dass die Zeilen an den Indexpositionen 2 und 4 (mit den Teams „B“ und „D“) beim Importieren der Excel-Datei in den Pandas DataFrame ignoriert wurden.

Beispiel 3: Ignorieren Sie die ersten N Zeilen

Wir können den folgenden Code verwenden, um die Excel-Datei zu importieren und die ersten beiden Zeilen zu ignorieren:

 import pandas as pd

#import DataFrame and skip first 2 rows
df = pd. read_excel (' player_data.xlsx ', skiprows= 2 )

#view DataFrame
print (df)

   B 20 12 3
0 C 15 4 7
1 D 19 4 8
2 E 32 6 8
3 F 13 7 9

Beachten Sie, dass die ersten beiden Zeilen der Excel-Datei übersprungen wurden und die nächste verfügbare Zeile (mit Team „B“) zur Kopfzeile des DataFrame geworden ist.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in Python ausführen:

So lesen Sie Excel-Dateien mit Pandas
So exportieren Sie Pandas DataFrame nach Excel
So exportieren Sie ein NumPy-Array in eine CSV-Datei

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert