Pandas: so geben sie typen beim importieren einer csv-datei an


Sie können die folgende grundlegende Syntax verwenden, um den Typ jeder Spalte in einem DataFrame anzugeben, wenn Sie eine CSV-Datei in Pandas importieren:

 df = pd. read_csv (' my_data.csv ',
                 dtype = {' col1 ': str , ' col2 ': float , ' col3 ': int })

Das Argument dtype gibt den Datentyp an, den jede Spalte haben sollte, wenn die CSV-Datei in einen Pandas-DataFrame importiert wird.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Geben Sie beim Importieren einer CSV-Datei in Pandas Typen an

Nehmen wir an, wir haben die folgende CSV-Datei mit dem Namen „basketball_data.csv“ :

Wenn wir die CSV-Datei mit der Funktion read_csv() importieren, versucht Pandas, den Datentyp für jede Spalte automatisch zu identifizieren:

 import pandas as pd

#import CSV file
df = pd. read_csv (' basketball_data.csv ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
int64 dots
rebounds int64
dtype:object

Aus dem Ergebnis können wir erkennen, dass die Spalten des DataFrame die folgenden Datentypen haben:

  • Team : Objekt
  • Punkte : int64
  • springt : int64

Wir können jedoch das Argument dtype in der Funktion read_csv() verwenden, um die Datentypen anzugeben, die jede Spalte haben soll:

import pandas as pd

#import CSV file and specify dtype of each column
df = pd. read_csv (' basketball_data.csv ',
                 dtype = {' team ': str , ' points ': float , ' rebounds ': int }))

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

#view data type of each column
print ( df.dtypes )

team object
float64 points
rebounds int32
dtype:object

Aus dem Ergebnis können wir erkennen, dass die Spalten des DataFrame die folgenden Datentypen haben:

  • Team : Objekt
  • Punkte : float64
  • springt : int32

Diese Datentypen entsprechen denen, die wir mit dem Argument dtype angegeben haben.

Beachten Sie, dass wir in diesem Beispiel den Typ für jede Spalte im DataFrame angegeben haben.

Sie können jedoch den Typ nur für bestimmte Spalten angeben und Pandas den Typ für die übrigen Spalten ableiten lassen.

Hinweis : Die vollständige Dokumentation der Funktion pandas read_csv() finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

Pandas: So überspringen Sie Zeilen beim Lesen einer CSV-Datei
Pandas: So fügen Sie Daten zu einer vorhandenen CSV-Datei hinzu
Pandas: So lesen Sie eine CSV-Datei ohne Header
Pandas: So legen Sie Spaltennamen beim Importieren einer CSV-Datei fest

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert