Pandas: so wählen sie spalten nach datentyp aus


Mit den folgenden Methoden können Sie Spalten in einem Pandas-DataFrame auswählen, die einem bestimmten Datentyp entsprechen:

Methode 1: Wählen Sie Spalten aus, die einem bestimmten Datentyp entsprechen

 #select all columns that have an int or float data type
df. select_dtypes (include=[' int ', ' float '])

Methode 2: Wählen Sie verschiedene Spalten eines bestimmten Datentyps aus

 #select all columns that don't have a bool or object data type
df. select_dtypes (exclude=[' bool ', ' object '])

Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                   ' points ': [18, 22, 19, 14, 14, 11],
                   ' assists ': [5, 7, 7, 9, 12, 9],
                   ' minutes ': [10.1, 12.0, 9.0, 8.0, 8.4, 7.5],
                   ' all_star ': [True, False, False, True, True, True]})

#view DataFrame
print (df)

  team points assists minutes all_star
0 A 18 5 10.1 True
1 B 22 7 12.0 False
2 C 19 7 9.0 False
3 D 14 9 8.0 True
4 E 14 12 8.4 True
5 F 11 9 7.5 True

Beispiel 1: Wählen Sie Spalten aus, die einem bestimmten Datentyp entsprechen

Mit dem folgenden Code können wir alle Spalten im DataFrame auswählen, deren Datentyp int oder float ist:

 #select all columns that have an int or float data type
df. select_dtypes (include=[' int ', ' float '])

	minute assist points
0 18 5 10.1
1 22 7 12.0
2 19 7 9.0
3 14 9 8.0
4 14 12 8.4
5 11 9 7.5

Beachten Sie, dass nur Spalten mit einem Datentyp gleich int oder float ausgewählt werden.

Beispiel 2: Wählen Sie verschiedene Spalten eines bestimmten Datentyps aus

Mit dem folgenden Code können wir alle Spalten im DataFrame auswählen, deren Datentyp nicht gleich bool oder object ist:

 #select all columns that don't have a bool or object data type
df. select_dtypes (exclude=[' bool ', ' object '])

minute assist points
0 18 5 10.1
1 22 7 12.0
2 19 7 9.0
3 14 9 8.0
4 14 12 8.4
5 11 9 7.5

Beachten Sie, dass nur Spalten ausgewählt werden, deren Datentyp nicht gleich „bool“ oder „object“ ist.

Beachten Sie außerdem, dass Sie die folgende Syntax verwenden können, um den Datentyp jeder Spalte im DataFrame anzuzeigen:

 #display data type of all columns
df. dtypes

team object
int64 dots
assists int64
minutes float64
all_star bool
dtype:object

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

Pandas: So überprüfen Sie den Typ aller Spalten in DataFrame
Pandas: Index der Zeilen abrufen, deren Spalte mit dem Wert übereinstimmt
Pandas: So legen Sie eine Spalte als Index fest

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert