Come selezionare solo colonne numeriche in panda


È possibile utilizzare la seguente sintassi di base per selezionare solo colonne numeriche in un DataFrame panda:

 import pandas as pd
import numpy as np

df. select_dtypes (include= np.number )

L’esempio seguente mostra come utilizzare questa funzione nella pratica.

Esempio: seleziona solo colonne numeriche in Panda

Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Possiamo utilizzare la seguente sintassi per selezionare solo colonne numeriche dal DataFrame:

 import numpy as np

#select only the numeric columns in the DataFrame
df. select_dtypes (include= np.number )

        points assists rebounds
0 18 5 11
1 22 7 8
2 19 7 10
3 14 9 6
4 14 12 6
5 11 9 5
6 20 9 9
7 28 4 12

Da notare che sono state selezionate solo le tre colonne numeriche: punti , assist e rimbalzi .

Possiamo verificare che queste colonne siano numeriche utilizzando la funzione dtypes() per visualizzare il tipo di dati di ciascuna variabile nel DataFrame:

 #display data type of each variable in DataFrame
df. dtypes

team object
int64 dots
assists int64
rebounds int64
dtype:object

Dal risultato possiamo vedere che la squadra è un oggetto (cioè una corda) mentre punti , assist e rimbalzi sono tutti numerici.

Tieni presente che possiamo anche utilizzare il seguente codice per ottenere un elenco delle colonne numeriche di DataFrame:

 #display list of numeric variables in DataFrame
df. select_dtypes (include=np. number ). columns . tolist ()

['points', 'assists', 'rebounds']

Ciò ci consente di vedere rapidamente i nomi delle variabili numeriche nel DataFrame senza vedere i loro valori effettivi.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come selezionare le colonne per nome in Pandas
Come selezionare le colonne per indice in Pandas
Come selezionare colonne contenenti una stringa specifica in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *