Pandas: so geben sie typen beim importieren einer csv-datei an
Sie können die folgende grundlegende Syntax verwenden, um den Typ jeder Spalte in einem DataFrame anzugeben, wenn Sie eine CSV-Datei in Pandas importieren:
df = pd. read_csv (' my_data.csv ', dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })
Das Argument dtype gibt den Datentyp an, den jede Spalte haben sollte, wenn die CSV-Datei in einen Pandas-DataFrame importiert wird.
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Geben Sie beim Importieren einer CSV-Datei in Pandas Typen an
Nehmen wir an, wir haben die folgende CSV-Datei mit dem Namen „basketball_data.csv“ :
Wenn wir die CSV-Datei mit der Funktion read_csv() importieren, versucht Pandas, den Datentyp für jede Spalte automatisch zu identifizieren:
import pandas as pd #import CSV file df = pd. read_csv (' basketball_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object int64 dots rebounds int64 dtype:object
Aus dem Ergebnis können wir erkennen, dass die Spalten des DataFrame die folgenden Datentypen haben:
- Team : Objekt
- Punkte : int64
- springt : int64
Wir können jedoch das Argument dtype in der Funktion read_csv() verwenden, um die Datentypen anzugeben, die jede Spalte haben soll:
import pandas as pd #import CSV file and specify dtype of each column df = pd. read_csv (' basketball_data.csv ', dtype = {' team ': str , ' points ': float , ' rebounds ': int })) #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10 #view data type of each column print ( df.dtypes ) team object float64 points rebounds int32 dtype:object
Aus dem Ergebnis können wir erkennen, dass die Spalten des DataFrame die folgenden Datentypen haben:
- Team : Objekt
- Punkte : float64
- springt : int32
Diese Datentypen entsprechen denen, die wir mit dem Argument dtype angegeben haben.
Beachten Sie, dass wir in diesem Beispiel den Typ für jede Spalte im DataFrame angegeben haben.
Sie können jedoch den Typ nur für bestimmte Spalten angeben und Pandas den Typ für die übrigen Spalten ableiten lassen.
Hinweis : Die vollständige Dokumentation der Funktion pandas read_csv() finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:
Pandas: So überspringen Sie Zeilen beim Lesen einer CSV-Datei
Pandas: So fügen Sie Daten zu einer vorhandenen CSV-Datei hinzu
Pandas: So lesen Sie eine CSV-Datei ohne Header
Pandas: So legen Sie Spaltennamen beim Importieren einer CSV-Datei fest