Pandas: crie uma tabela dinâmica com vários aggfunc


Você pode usar a seguinte sintaxe para criar uma tabela dinâmica no pandas e fornecer vários valores ao argumento aggfunc :

 df. pivot_table (index=' col1 ', values=' col2 ', aggfunc=(' sum ', ' mean '))

Este exemplo específico cria uma tabela dinâmica que exibe a soma e a média dos valores em col2 , agrupados por col1 .

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Crie uma tabela dinâmica do Pandas com vários aggfunc

Suponha que temos o seguinte DataFrame do pandas que contém informações sobre vários jogadores de basquete:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Podemos usar o código a seguir para criar uma tabela dinâmica que resume a soma e o número médio de pontos marcados por cada equipe :

 #create pivot table to summarize sum and mean of points by team
df. pivot_table (index=' team ', values=' points ', aggfunc=(' sum ', ' mean '))

	mean sum
team		
At 4.50 18
B 6.50 26
C 5.75 23

A tabela dinâmica resultante resume a média e a soma dos pontos marcados por cada equipe.

Por exemplo, podemos ver:

  • Os jogadores do time A tiveram um valor médio de pontos de 4,50 e um valor total de pontos de 18 .
  • Os jogadores do time B tiveram um valor médio de pontos de 6,50 e um valor total de pontos de 26 .
  • Os jogadores do time C tiveram um valor médio de pontos de 5,75 e um valor total de pontos de 23 .

Observe que agregamos usando soma e média neste exemplo, mas também poderíamos agregar por outras métricas, como:

  • contar
  • min
  • máximo
  • mediana
  • padrão (desvio padrão)

O exemplo a seguir mostra como agregar os valores da coluna de pontos com base nessas métricas para cada equipe:

 #create pivot table to summarize several metrics for points by team
df. pivot_table (index=' team ', values=' points ',
               aggfunc=(' count ', ' min ', ' max ', ' median ', ' std '))

        count max median min std
team					
A 4 8 4.0 2 2.516611
B 4 9 6.0 5 1.914854
C 4 8 6.0 3 2.629956

Nota : Você pode encontrar a documentação completa da função pivot_table() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns do panda:

Pandas: Como classificar a tabela dinâmica por valores na coluna
Pandas: como criar uma tabela dinâmica com soma de valores
Pandas: como adicionar subtotais à tabela dinâmica
Pandas: como alterar os nomes das colunas em uma tabela dinâmica

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *