Pandas: como criar uma tabela dinâmica com número de valores
Você pode usar qualquer um dos seguintes métodos para criar uma tabela dinâmica no pandas que exibe o número de valores em determinadas colunas:
Método 1: tabela dinâmica com números
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=' count ')
Método 2: tabela dinâmica com números exclusivos
p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=pd. Series . nunique )
Os exemplos a seguir mostram como usar cada método com o seguinte DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'], ' points ': [4, 4, 6, 8, 9, 5, 5, 12]}) #view DataFrame df team position points 0 A G 4 1 A G 4 2 A F 6 3 A C 8 4 B G 9 5 B F 5 6 B F 5 7 B F 12
Método 1: criar uma tabela dinâmica do Pandas com contagens
O código a seguir mostra como criar uma tabela dinâmica no pandas que exibe o número total de valores de “pontos” para cada “equipe” e “posição” no DataFrame:
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
aggfunc=' count ')
#view pivot table
df_pivot
position C F G
team
A 1.0 1.0 2.0
B NaN 3.0 1.0
Pelo resultado podemos ver:
- Há 1 valor na coluna “pontos” para a equipe A na posição C.
- Há 1 valor na coluna “pontos” para a equipe A na posição F.
- Existem 2 valores na coluna “pontos” para a equipe A na posição G.
E assim por diante.
Método 2: criar uma tabela dinâmica do Pandas com contagens exclusivas
O código a seguir mostra como criar uma tabela dinâmica no pandas que exibe o número total exclusivo de valores de “ponto” para cada “equipe” e “posição” no DataFrame:
#create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
aggfunc=pd. Series . nunique )
#view pivot table
df_pivot
position C F G
team
A 1.0 1.0 1.0
B NaN 2.0 1.0
Pelo resultado podemos ver:
- Existe 1 valor único na coluna “pontos” para a equipe A na posição C.
- Existe 1 valor único na coluna “pontos” para a equipe A na posição F.
- Existe 1 valor único na coluna “pontos” para a equipe A na posição G.
E assim por diante.
Nota : Você pode encontrar a documentação completa da função pivot_table() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Pandas: Como remodelar o DataFrame de longo para largo
Pandas: Como remodelar o DataFrame de largo para longo
Pandas: como agrupar e agregar em várias colunas