Pandas: so lesen sie nur bestimmte zeilen aus einer csv-datei
Sie können die folgende grundlegende Syntax verwenden, um nur bestimmte Zeilen aus einer CSV-Datei in einen Pandas-DataFrame einzulesen:
#specify rows to import
specific_rows = [ 0 , 2 , 3 ]
#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)
In diesem speziellen Beispiel werden Zeilen an den Indexpositionen 0, 2 und 3 aus einer CSV-Datei namens my_data.csv in einen Pandas-DataFrame gelesen.
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Nur bestimmte Zeilen aus einer CSV-Datei in Pandas lesen
Nehmen wir an, wir haben die folgende CSV-Datei mit dem Namen „basketball_data.csv“ :
Wenn wir die Funktion read_csv() verwenden, importiert Pandas automatisch jede Zeile der CSV-Datei in einen DataFrame:
import pandas as pd #import all rows of CSV into DataFrame df = pd. read_csv (' basketball_data.csv ') #view DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2
Wir können jedoch die folgende Syntax verwenden, um nur die Zeilen an den Indexpositionen 0, 2 und 3 aus der CSV-Datei in einen Pandas-DataFrame zu importieren:
import pandas as pd #specify rows to import specific_rows = [ 0 , 2 , 3 ] #import specific rows from CSV into DataFrame df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows) #view DataFrame print (df) team points rebounds 0 B 14 9 1 C 29 6
Beachten Sie, dass nur Zeilen an den Indexpositionen 0, 2 und 3 der CSV-Datei in den DataFrame importiert werden.
Diese Syntax verwendet das Argument „skiprows“ und eine Lambda- Funktion, um Pandas mitzuteilen, welche Zeilen beim Importieren der CSV-Datei nicht übersprungen werden sollen .
In diesem Beispiel weisen wir Pandas an, Zeilen an den Indexpositionen 0, 2 und 3 nicht zu ignorieren, sondern alle anderen Zeilen beim Importieren der CSV-Datei.
Hinweis : Die vollständige Dokumentation der Funktion pandas read_csv() finden Sie hier .
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in Python ausführen:
Pandas: So überspringen Sie Zeilen beim Lesen einer CSV-Datei
Pandas: So fügen Sie Daten zu einer vorhandenen CSV-Datei hinzu
Pandas: So geben Sie Typen beim Importieren einer CSV-Datei an
Pandas: So legen Sie Spaltennamen beim Importieren einer CSV-Datei fest