Panda: come utilizzare loc per selezionare più colonne
È possibile utilizzare la funzione loc in panda per selezionare più colonne in un DataFrame per etichetta.
Ecco i modi più comuni per farlo:
Metodo 1: seleziona più colonne per nome
df. loc [:,[' col2 ',' col4 ']]
Metodo 2: seleziona tutte le colonne nell’intervallo
df. loc [:, ' col2 ':' col4 ']
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [5, 7, 7, 9, 12, 9, 9, 4], ' assists ': [11, 8, 10, 6, 6, 5, 9, 12], ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]}) #view DataFrame print (df) team points assists rebounds 0 A 5 11 6 1 To 7 8 7 2 To 7 10 7 3 to 9 6 6 4 B 12 6 10 5 B 9 5 12 6 B 9 9 10 7 B 4 12 9
Esempio 1: seleziona più colonne per nome
Il codice seguente mostra come utilizzare la funzione loc per selezionare le colonne “punti” e “rimbalzi” del DataFrame:
#select points and rebounds columns
df. loc [:,[' points ',' rebounds ']]
rebound points
0 5 6
1 7 7
2 7 7
3 9 6
4 12 10
5 9 12
6 9 10
7 4 9
Tieni presente che viene restituita ogni riga nelle colonne “punti” e “rimbalzi”.
Tieni inoltre presente che l’ordine in cui specifichi le colonne nella funzione loc è l’ordine in cui verranno restituite.
Ad esempio, potremmo restituire prima la colonna “rimbalzi”, poi la colonna “punti”:
#select rebounds and points columns
df. loc [:, [' rebounds ', ' points ']]
rebound points
0 6 5
1 7 7
2 7 7
3 6 9
4 10 12
5 12 9
6 10 9
7 9 4
Esempio 2: seleziona tutte le colonne nell’intervallo
Il codice seguente mostra come utilizzare la funzione loc per selezionare tutte le colonne tra le colonne “punti” e “rimbalzi” nel DataFrame:
#select all columns between points and rebounds columns
df. loc [:, ' points ': ' rebounds ']
points assists rebounds
0 5 11 6
1 7 8 7
2 7 10 7
3 9 6 6
4 12 6 10
5 9 5 12
6 9 9 10
7 4 12 9
Tieni presente che vengono restituite tutte le colonne tra le colonne “punti” e “rimbalzi” nel DataFrame.
Nota : per selezionare le colonne in base alla posizione dell’indice, utilizzare invece la funzione iloc .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:
Come selezionare le righe in base a più condizioni utilizzando Pandas Loc
Come selezionare le righe in base ai valori delle colonne in Pandas
Come selezionare le righe per indice in Pandas