Panda: come utilizzare loc per selezionare più colonne


È possibile utilizzare la funzione loc in panda per selezionare più colonne in un DataFrame per etichetta.

Ecco i modi più comuni per farlo:

Metodo 1: seleziona più colonne per nome

 df. loc [:,[' col2 ',' col4 ']]

Metodo 2: seleziona tutte le colonne nell’intervallo

 df. loc [:, ' col2 ':' col4 ']

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

Esempio 1: seleziona più colonne per nome

Il codice seguente mostra come utilizzare la funzione loc per selezionare le colonne “punti” e “rimbalzi” del DataFrame:

 #select points and rebounds columns
df. loc [:,[' points ',' rebounds ']]

        rebound points
0 5 6
1 7 7
2 7 7
3 9 6
4 12 10
5 9 12
6 9 10
7 4 9

Tieni presente che viene restituita ogni riga nelle colonne “punti” e “rimbalzi”.

Tieni inoltre presente che l’ordine in cui specifichi le colonne nella funzione loc è l’ordine in cui verranno restituite.

Ad esempio, potremmo restituire prima la colonna “rimbalzi”, poi la colonna “punti”:

 #select rebounds and points columns
df. loc [:, [' rebounds ', ' points ']]

	rebound points
0 6 5
1 7 7
2 7 7
3 6 9
4 10 12
5 12 9
6 10 9
7 9 4

Esempio 2: seleziona tutte le colonne nell’intervallo

Il codice seguente mostra come utilizzare la funzione loc per selezionare tutte le colonne tra le colonne “punti” e “rimbalzi” nel DataFrame:

 #select all columns between points and rebounds columns
df. loc [:, ' points ': ' rebounds ']

	points assists rebounds
0 5 11 6
1 7 8 7
2 7 10 7
3 9 6 6
4 12 6 10
5 9 5 12
6 9 9 10
7 4 12 9

Tieni presente che vengono restituite tutte le colonne tra le colonne “punti” e “rimbalzi” nel DataFrame.

Nota : per selezionare le colonne in base alla posizione dell’indice, utilizzare invece la funzione iloc .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:

Come selezionare le righe in base a più condizioni utilizzando Pandas Loc
Come selezionare le righe in base ai valori delle colonne in Pandas
Come selezionare le righe per indice in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *