Pandas: como adicionar filtro à tabela dinâmica


Você pode usar a seguinte sintaxe básica para adicionar uma condição de filtro a uma tabela dinâmica do pandas:

 df[df. col1 == ' A ']. pivot_table (index=' col1 ', values=[' col2 ', ' col3 '], aggfunc=' sum ')

Este exemplo específico cria uma tabela dinâmica que exibe a soma dos valores de col2 e col3 , agrupados por col1 .

O filtro antes da função pivot_table() especifica que queremos incluir apenas linhas onde o valor em col1 do DataFrame original tenha o valor “A”.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: como adicionar um filtro à tabela dinâmica do Pandas

Suponha que temos o seguinte DataFrame do pandas que contém informações sobre vários jogadores de basquete:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Podemos usar o código a seguir para criar uma tabela dinâmica no pandas que exibe a soma dos valores nos pontos e colunas auxiliares agrupadas por equipe apenas para linhas onde o DataFrame original possui um valor na coluna de pontuação. equipe igual a “A”:

 #create pivot table for rows where team is equal to 'A'
df[df. team == ' A ']. pivot_table (index=' team ', values=[' points ', ' assists '],
                                 aggfunc=' sum ')

        assist points
team		
At 14 18

Observe que a tabela dinâmica apenas resume os valores dos pontos e colunas de assistência para linhas onde time é igual a “A”.

Você também pode usar os operadores & e | para aplicar um filtro que use a lógica “AND” ou “OR”.

Por exemplo, podemos usar a seguinte sintaxe para criar uma tabela dinâmica que filtra linhas onde o valor na coluna da equipe do DataFrame original é igual a “A” ou “B”:

 #create pivot table for rows where team is equal to 'A' or 'B'
df[( df.team == ' A ') | (df. team == ' B ')]. pivot_table (index=' team ',
                                                    values=[' points ', ' assists '],
                                                    aggfunc=' sum ')

	assist points
team		
At 14 18
B 19 26

Observe que a tabela dinâmica apenas resume os valores nas colunas de pontos e assistência para linhas onde time é igual a “A” ou “B”.

Nota : Você pode encontrar a documentação completa da função pivot_table() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Pandas: Como classificar a tabela dinâmica por valores na coluna
Pandas: como criar uma tabela dinâmica com soma de valores
Pandas: como adicionar subtotais à tabela dinâmica
Pandas: como alterar os nomes das colunas em uma tabela dinâmica

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *