Panda: come modificare i nomi delle colonne in una tabella pivot
Spesso potresti voler modificare o formattare i nomi delle colonne in una tabella pivot Pandas in un modo specifico.
Fortunatamente, questo è facile da fare utilizzando le funzioni integrate dei panda.
L’esempio seguente mostra come eseguire questa operazione.
Esempio: modificare i nomi delle colonne nella tabella pivot di Pandas
Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'C', 'G', 'C', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B G 9 5 B C 5 6 B F 5 7 B F 12
Possiamo utilizzare il seguente codice per creare una tabella pivot in panda che mostra il valore del punto medio per ciascuna squadra e posizione nel DataFrame:
#create pivot table
piv = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ')
#view pivot table
print (piv)
CFG position
team
A 8.0 6.0 4.0
B 5.0 8.5 9.0
Ora diciamo che vogliamo rimuovere la posizione della parola nella tabella pivot e rimuovere la riga extra della squadra dalla tabella pivot.
Possiamo usare la seguente sintassi per fare ciò:
#format column names
iv. columns = ['_'. join (str(s). strip () for s in col if s) for col in piv. columns ]
#reset indexes
iv. reset_index (inplace= True )
#view updated pivot table
print (piv)
team CFG
0 A 8.0 6.0 4.0
1 B 5.0 8.5 9.0
Tieni presente che siamo riusciti a rimuovere la posizione della parola nella tabella pivot e rimuovere la riga aggiuntiva della squadra dalla tabella pivot.
Tieni inoltre presente che questa soluzione generale funzionerà anche per una tabella pivot con un multiindice.
Nota : puoi trovare la documentazione completa della funzione panda pivot_table() qui .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:
Panda: come creare una tabella pivot con numero di valori
Panda: come sostituire i valori NaN nella tabella pivot con zeri
Panda: come convertire una tabella pivot in DataFrame