Pandas: ignorieren sie die erste spalte beim importieren einer csv-datei


Sie können die folgende grundlegende Syntax verwenden, um die erste Spalte beim Importieren einer CSV-Datei in einen Pandas-DataFrame zu ignorieren:

 with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

In diesem speziellen Beispiel wird jede Spalte einer CSV-Datei mit dem Namen „basketball_data.csv“ in einen Pandas-DataFrame eingelesen, mit Ausnahme der ersten Spalte.

Mit diesem Code ermitteln wir zunächst die Anzahl der Spalten in der CSV-Datei und weisen sie einer Variablen namens ncols zu.

Als nächstes verwenden wir das Argument usecols , um anzugeben, dass wir nur die Spalten zwischen 1 (d. h. der zweiten Spalte) und der letzten Spalte der CSV-Datei importieren möchten.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Ignorieren Sie die erste Spalte, wenn Sie eine CSV-Datei in Pandas importieren

Nehmen wir an, wir haben die folgende CSV-Datei mit dem Namen „basketball_data.csv“ :

Wir können die folgende Syntax verwenden, um die CSV-Datei in einen Pandas-DataFrame zu importieren und die erste Spalte zu ignorieren:

 import pandas as pd

#calculate number of columns in CSV file
with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Beachten Sie, dass die erste Spalte mit dem Namen „Team“ entfernt wurde, als wir die CSV-Datei in Pandas importierten.

Beachten Sie: Wenn Sie die Gesamtzahl der Spalten in der CSV-Datei bereits im Voraus kennen, können Sie diesen Wert direkt an das Argument usecols übergeben.

Angenommen, wir wissen bereits, dass die CVS-Datei drei Spalten enthält.

Wir könnten die folgende Syntax verwenden, um die CSV-Datei in einen Pandas-DataFrame zu importieren und die erste Spalte zu ignorieren:

 import pandas as pd

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Beachten Sie, dass die erste Spalte mit dem Namen „Team“ entfernt wurde, als wir die CSV-Datei in Pandas importierten.

Da wir bereits wussten, dass die CSV-Datei drei Spalten enthält, haben wir einfach „range(1,3)“ im Argument „usecols “ verwendet.

Hinweis : Die vollständige Dokumentation der Funktion pandas read_csv() finden Sie hier .

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in Python ausführen:

Pandas: So überspringen Sie Zeilen beim Lesen einer CSV-Datei
Pandas: So fügen Sie Daten zu einer vorhandenen CSV-Datei hinzu
Pandas: So verwenden Sie read_csv mit dem Argument usecols

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert