Pandas: ignorieren sie die erste spalte beim importieren einer csv-datei
Sie können die folgende grundlegende Syntax verwenden, um die erste Spalte beim Importieren einer CSV-Datei in einen Pandas-DataFrame zu ignorieren:
with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))
In diesem speziellen Beispiel wird jede Spalte einer CSV-Datei mit dem Namen „basketball_data.csv“ in einen Pandas-DataFrame eingelesen, mit Ausnahme der ersten Spalte.
Mit diesem Code ermitteln wir zunächst die Anzahl der Spalten in der CSV-Datei und weisen sie einer Variablen namens ncols zu.
Als nächstes verwenden wir das Argument usecols , um anzugeben, dass wir nur die Spalten zwischen 1 (d. h. der zweiten Spalte) und der letzten Spalte der CSV-Datei importieren möchten.
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Ignorieren Sie die erste Spalte, wenn Sie eine CSV-Datei in Pandas importieren
Nehmen wir an, wir haben die folgende CSV-Datei mit dem Namen „basketball_data.csv“ :
Wir können die folgende Syntax verwenden, um die CSV-Datei in einen Pandas-DataFrame zu importieren und die erste Spalte zu ignorieren:
import pandas as pd #calculate number of columns in CSV file with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Beachten Sie, dass die erste Spalte mit dem Namen „Team“ entfernt wurde, als wir die CSV-Datei in Pandas importierten.
Beachten Sie: Wenn Sie die Gesamtzahl der Spalten in der CSV-Datei bereits im Voraus kennen, können Sie diesen Wert direkt an das Argument usecols übergeben.
Angenommen, wir wissen bereits, dass die CVS-Datei drei Spalten enthält.
Wir könnten die folgende Syntax verwenden, um die CSV-Datei in einen Pandas-DataFrame zu importieren und die erste Spalte zu ignorieren:
import pandas as pd #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Beachten Sie, dass die erste Spalte mit dem Namen „Team“ entfernt wurde, als wir die CSV-Datei in Pandas importierten.
Da wir bereits wussten, dass die CSV-Datei drei Spalten enthält, haben wir einfach „range(1,3)“ im Argument „usecols “ verwendet.
Hinweis : Die vollständige Dokumentation der Funktion pandas read_csv() finden Sie hier .
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in Python ausführen:
Pandas: So überspringen Sie Zeilen beim Lesen einer CSV-Datei
Pandas: So fügen Sie Daten zu einer vorhandenen CSV-Datei hinzu
Pandas: So verwenden Sie read_csv mit dem Argument usecols