Pandas: so überspringen sie zeilen beim lesen einer excel-datei
Sie können die folgenden Methoden verwenden, um Zeilen zu überspringen, wenn Sie eine Excel-Datei in einen Pandas-DataFrame einlesen:
Methode 1: Eine bestimmte Zeile überspringen
#import DataFrame and skip row in index position 2 df = pd. read_excel (' my_data.xlsx ', skiprows=[ 2 ])
Methode 2: Ignorieren mehrerer spezifischer Zeilen
#import DataFrame and skip rows in index positions 2 and 4 df = pd. read_excel (' my_data.xlsx ' , skiprows=[2,4 ] )
Methode 3: Ignorieren Sie die ersten N Zeilen
#import DataFrame and skip first 2 rows df = pd. read_excel (' my_data.xlsx ', skiprows= 2 )
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit der folgenden Excel-Datei namens player_data.xlsx verwendet wird:
Beispiel 1: Eine bestimmte Zeile ignorieren
Wir können den folgenden Code verwenden, um die Excel-Datei zu importieren und die Zeile an Indexposition 2 zu ignorieren:
import pandas as pd #import DataFrame and skip row in index position 2 df = pd. read_excel (' player_data.xlsx ', skiprows=[ 2 ]) #view DataFrame print (df) team points rebound assists 0 to 24 8 5 1 C 15 4 7 2 D 19 4 8 3 E 32 6 8 4 F 13 7 9
Beachten Sie, dass die Zeile an Indexposition 2 (mit Team „B“) beim Importieren der Excel-Datei in den Pandas DataFrame ignoriert wurde.
Hinweis : Die erste Zeile der Excel-Datei wird als Zeile 0 betrachtet.
Beispiel 2: Ignorieren mehrerer spezifischer Zeilen
Mit dem folgenden Code können wir die Excel-Datei importieren und die Zeilen an den Indexpositionen 2 und 4 ignorieren:
import pandas as pd #import DataFrame and skip rows in index positions 2 and 4 df = pd. read_excel (' player_data.xlsx ', skiprows=[ 2,4 ] ) #view DataFrame print (df) team points rebound assists 0 to 24 8 5 1 C 15 4 7 2 E 32 6 8 3 F 13 7 9
Beachten Sie, dass die Zeilen an den Indexpositionen 2 und 4 (mit den Teams „B“ und „D“) beim Importieren der Excel-Datei in den Pandas DataFrame ignoriert wurden.
Beispiel 3: Ignorieren Sie die ersten N Zeilen
Wir können den folgenden Code verwenden, um die Excel-Datei zu importieren und die ersten beiden Zeilen zu ignorieren:
import pandas as pd #import DataFrame and skip first 2 rows df = pd. read_excel (' player_data.xlsx ', skiprows= 2 ) #view DataFrame print (df) B 20 12 3 0 C 15 4 7 1 D 19 4 8 2 E 32 6 8 3 F 13 7 9
Beachten Sie, dass die ersten beiden Zeilen der Excel-Datei übersprungen wurden und die nächste verfügbare Zeile (mit Team „B“) zur Kopfzeile des DataFrame geworden ist.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in Python ausführen:
So lesen Sie Excel-Dateien mit Pandas
So exportieren Sie Pandas DataFrame nach Excel
So exportieren Sie ein NumPy-Array in eine CSV-Datei