Pandas: como criar uma tabela dinâmica com número de valores


Você pode usar qualquer um dos seguintes métodos para criar uma tabela dinâmica no pandas que exibe o número de valores em determinadas colunas:

Método 1: tabela dinâmica com números

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=' count ')

Método 2: tabela dinâmica com números exclusivos

 p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ',
               aggfunc=pd. Series . nunique )

Os exemplos a seguir mostram como usar cada método com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'C', 'G', 'F', 'F', 'F'],
                   ' points ': [4, 4, 6, 8, 9, 5, 5, 12]})

#view DataFrame
df

	team position points
0 A G 4
1 A G 4
2 A F 6
3 A C 8
4 B G 9
5 B F 5
6 B F 5
7 B F 12

Método 1: criar uma tabela dinâmica do Pandas com contagens

O código a seguir mostra como criar uma tabela dinâmica no pandas que exibe o número total de valores de “pontos” para cada “equipe” e “posição” no DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=' count ')

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 2.0
   B NaN 3.0 1.0

Pelo resultado podemos ver:

  • 1 valor na coluna “pontos” para a equipe A na posição C.
  • 1 valor na coluna “pontos” para a equipe A na posição F.
  • Existem 2 valores na coluna “pontos” para a equipe A na posição G.

E assim por diante.

Método 2: criar uma tabela dinâmica do Pandas com contagens exclusivas

O código a seguir mostra como criar uma tabela dinâmica no pandas que exibe o número total exclusivo de valores de “ponto” para cada “equipe” e “posição” no DataFrame:

 #create pivot table
df_pivot = pd. pivot_table (df, values=' points ', index=' team ', columns=' position ',
                          aggfunc=pd. Series . nunique )

#view pivot table
df_pivot

position C F G
team			
   A 1.0 1.0 1.0
   B NaN 2.0 1.0

Pelo resultado podemos ver:

  • Existe 1 valor único na coluna “pontos” para a equipe A na posição C.
  • Existe 1 valor único na coluna “pontos” para a equipe A na posição F.
  • Existe 1 valor único na coluna “pontos” para a equipe A na posição G.

E assim por diante.

Nota : Você pode encontrar a documentação completa da função pivot_table() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Pandas: Como remodelar o DataFrame de longo para largo
Pandas: Como remodelar o DataFrame de largo para longo
Pandas: como agrupar e agregar em várias colunas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *