Panda: crea una tabella pivot con più aggfunc


Puoi utilizzare la seguente sintassi per creare una tabella pivot in panda e fornire più valori all’argomento aggfunc :

 df. pivot_table (index=' col1 ', values=' col2 ', aggfunc=(' sum ', ' mean '))

Questo particolare esempio crea una tabella pivot che visualizza la somma e la media dei valori in col2 , raggruppati per col1 .

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: creare una tabella pivot Pandas con più aggfunc

Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Possiamo utilizzare il seguente codice per creare una tabella pivot che riepiloghi sia la somma che il numero medio di punti segnati da ciascuna squadra :

 #create pivot table to summarize sum and mean of points by team
df. pivot_table (index=' team ', values=' points ', aggfunc=(' sum ', ' mean '))

	mean sum
team		
At 4.50 18
B 6.50 26
C 5.75 23

La tabella pivot risultante riassume la media e la somma dei punti segnati da ciascuna squadra.

Ad esempio, possiamo vedere:

  • I giocatori della squadra A avevano un valore medio di 4,50 e un valore totale di 18 .
  • I giocatori della squadra B avevano un valore medio di 6,50 e un valore totale di 26 .
  • I giocatori della squadra C avevano un valore medio di 5,75 e un valore totale di 23 .

Tieni presente che in questo esempio abbiamo effettuato l’aggregazione utilizzando la somma e la media, ma potremmo anche eseguire l’aggregazione in base ad altri parametri, ad esempio:

  • contare
  • min
  • massimo
  • mediano
  • std (deviazione standard)

L’esempio seguente mostra come aggregare i valori della colonna dei punti in base a queste metriche per ciascuna squadra:

 #create pivot table to summarize several metrics for points by team
df. pivot_table (index=' team ', values=' points ',
               aggfunc=(' count ', ' min ', ' max ', ' median ', ' std '))

        count max median min std
team					
A 4 8 4.0 2 2.516611
B 4 9 6.0 5 1.914854
C 4 8 6.0 3 2.629956

Nota : puoi trovare la documentazione completa della funzione panda pivot_table() qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni dei panda:

Panda: come ordinare la tabella pivot in base ai valori nella colonna
Panda: come creare una tabella pivot con una somma di valori
Panda: come aggiungere totali parziali alla tabella pivot
Panda: come modificare i nomi delle colonne in una tabella pivot

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *