Pandas: so überspringen sie zeilen beim lesen einer csv-datei
Sie können die folgenden Methoden verwenden, um Zeilen zu überspringen, wenn Sie eine CSV-Datei in einen Pandas-DataFrame lesen:
Methode 1: Eine bestimmte Zeile überspringen
#import DataFrame and skip 2nd row df = pd. read_csv ('my_data.csv', skiprows=[ 2 ])
Methode 2: Ignorieren mehrerer spezifischer Zeilen
#import DataFrame and skip 2nd and 4th row df = pd. read_csv (' my_data.csv', skiprows=[2,4 ] )
Methode 3: Ignorieren Sie die ersten N Zeilen
#import DataFrame and skip first 2 rows df = pd. read_csv ('my_data.csv', skiprows= 2 )
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit der folgenden CSV-Datei namens „basketball_data.csv“ verwendet wird:
Beispiel 1: Eine bestimmte Zeile ignorieren
Wir können den folgenden Code verwenden, um die CSV-Datei zu importieren und die zweite Zeile zu ignorieren:
import pandas as pd #import DataFrame and skip 2nd row df = pd. read_csv ('basketball_data.csv', skiprows=[ 2 ]) #view DataFrame df team points rebounds 0 to 22 10 1 C 29 6 2 D 30 2
Beachten Sie, dass die zweite Zeile (mit Team „B“) beim Importieren der CSV-Datei in den Pandas DataFrame ignoriert wurde.
Hinweis : Die erste Zeile der CSV-Datei wird als Zeile 0 betrachtet.
Beispiel 2: Ignorieren mehrerer spezifischer Zeilen
Wir können den folgenden Code verwenden, um die CSV-Datei zu importieren und die zweite und vierte Zeile zu überspringen:
import pandas as pd #import DataFrame and skip 2nd and 4th rows df = pd. read_csv ('basketball_data.csv', skiprows=[ 2 , 4 ]) #view DataFrame df team points rebounds 0 to 22 10 1 C 29 6
Beachten Sie, dass die zweite und vierte Zeile (mit den Teams „B“ und „D“) beim Importieren der CSV-Datei in den Pandas DataFrame ignoriert wurden.
Beispiel 3: Ignorieren Sie die ersten N Zeilen
Wir können den folgenden Code verwenden, um die CSV-Datei zu importieren und die ersten beiden Zeilen zu überspringen:
import pandas as pd #import DataFrame and skip first 2 rows df = pd. read_csv ('basketball_data.csv', skiprows= 2 ) #view DataFrame df B 14 9 0 C 29 6 1 D 30 2
Beachten Sie, dass die ersten beiden Zeilen der CSV-Datei übersprungen wurden und die nächste verfügbare Zeile (mit Team „B“) zur Kopfzeile des DataFrame geworden ist.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in Python ausführen:
So lesen Sie Excel-Dateien mit Pandas
So exportieren Sie Pandas DataFrame nach Excel
So exportieren Sie ein NumPy-Array in eine CSV-Datei