Pandas: como adicionar subtotais à tabela dinâmica
Freqüentemente, você pode querer adicionar subtotais a uma tabela dinâmica do pandas.
Felizmente, isso é fácil de fazer usando as funções integradas do pandas.
O exemplo a seguir mostra como fazer isso.
Exemplo: adicionar subtotais à tabela dinâmica do Pandas
Suponha que temos o seguinte DataFrame do pandas que contém informações sobre vários jogadores de basquete:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'F', 'G', 'F', 'F', 'F'], ' all_star ': ['Y', 'N', 'Y', 'Y', 'N', 'N', 'N', 'Y'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame print (df) team position all_star points 0 AGY 4 1 AGN 4 2 AFY 6 3 AFY 8 4 BGN 9 5 BFN 5 6 BFN 5 7 BFY 12
Podemos usar o código a seguir para criar uma tabela dinâmica no pandas que exibe a soma dos pontos para cada combinação de team , all_star e position no DataFrame:
#create pivot table
my_table = pd. pivot_table (df, values=' points ',
index=[' team ', ' all_star '],
columns=' position ',
aggfunc=' sum ')
#view pivot table
print (my_table)
FG position
team all_star
AN NaN 4.0
Y 14.0 4.0
BN 10.0 9.0
Y 12.0 NaN
Agora digamos que queremos adicionar uma linha de subtotais que exiba os pontos do subtotal para cada equipe e posição.
Podemos usar a seguinte sintaxe para fazer isso:
#add subtotals row to pivot table
p.d. concat ([
y. append ( y.sum (). rename ((x, ' Total ')))
for x, y in my_table. groupby (level= 0 )
]). append ( my_table.sum (). rename ((' Large ', ' Total ')))
position F G
team all_star
A N NaN 4.0
Y 7.0 4.0
Overall 7.0 8.0
B N 5.0 9.0
Y 12.0 NaN
Total 17.0 9.0
Grand Total 24.0 17.0
Agora temos duas linhas de subtotais que mostram o subtotal de pontos para cada equipe e posição, bem como uma linha de total geral que mostra o total geral de cada coluna.
Nota : Você pode encontrar a documentação completa da função pivot_table() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Pandas: Como criar uma tabela dinâmica com número de valores
Pandas: como substituir valores NaN na tabela dinâmica por zeros
Pandas: Como converter tabela dinâmica em DataFrame