So wählen sie in pandas nur numerische spalten aus


Sie können die folgende grundlegende Syntax verwenden, um nur numerische Spalten in einem Pandas-DataFrame auszuwählen:

 import pandas as pd
import numpy as np

df. select_dtypes (include= np.number )

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: Wählen Sie in Pandas nur numerische Spalten aus

Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über verschiedene Basketballspieler enthält:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Wir können die folgende Syntax verwenden, um nur numerische Spalten aus dem DataFrame auszuwählen:

 import numpy as np

#select only the numeric columns in the DataFrame
df. select_dtypes (include= np.number )

        points assists rebounds
0 18 5 11
1 22 7 8
2 19 7 10
3 14 9 6
4 14 12 6
5 11 9 5
6 20 9 9
7 28 4 12

Beachten Sie, dass nur die drei numerischen Spalten ausgewählt wurden – Punkte , Assists und Rebounds .

Wir können überprüfen, ob diese Spalten numerisch sind, indem wir die Funktion dtypes() verwenden, um den Datentyp jeder Variablen im DataFrame anzuzeigen:

 #display data type of each variable in DataFrame
df. dtypes

team object
int64 dots
assists int64
rebounds int64
dtype:object

Aus dem Ergebnis können wir erkennen, dass das Team ein Objekt (dh eine Zeichenfolge) ist, während Punkte , Assists und Rebounds alle numerisch sind.

Beachten Sie, dass wir auch den folgenden Code verwenden können, um eine Liste der numerischen Spalten des DataFrame abzurufen:

 #display list of numeric variables in DataFrame
df. select_dtypes (include=np. number ). columns . tolist ()

['points', 'assists', 'rebounds']

Dadurch können wir schnell die Namen numerischer Variablen im DataFrame sehen, ohne ihre tatsächlichen Werte zu sehen.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So wählen Sie Spalten nach Namen in Pandas aus
So wählen Sie Spalten nach Index in Pandas aus
So wählen Sie in Pandas Spalten aus, die eine bestimmte Zeichenfolge enthalten

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert