Pandas: como classificar a tabela dinâmica por valores na coluna
Você pode usar a seguinte sintaxe básica para classificar uma tabela dinâmica do pandas com base nos valores de uma coluna:
my_pivot_table. sort_values (by=[' some_column '], ascending= False )
Este exemplo específico classifica os valores de uma tabela dinâmica chamada my_pivot_table com base nos valores de some_column em ordem decrescente.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Classifique a tabela dinâmica do Pandas por valores na coluna
Suponha que temos o seguinte DataFrame do pandas que contém informações sobre vários jogadores de basquete:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C'], ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3], ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]}) #view DataFrame print (df) team points assists 0 to 4 2 1 to 4 2 2 to 2 5 3 to 8 5 4 B 9 4 5 B 5 7 6 B 5 5 7 B 7 3 8 C 8 9 9 C 8 8 10 C 4 4 11 C 3 4
Podemos usar o código a seguir para criar uma tabela dinâmica no pandas que exibe a soma dos valores nas colunas de pontos e assistência de cada equipe:
#create pivot table
df_pivot = df. pivot_table (index=[' team '], values=[' points ', ' assists '], aggfunc=' sum ')
#view pivot table
print (df_pivot)
assist points
team
At 14 18
B 19 26
C 25 23
Por padrão, o pandas classifica as linhas da tabela dinâmica em ordem alfabética com base no valor da coluna do índice, que é a coluna da equipe .
No entanto, podemos usar a função sort_values() para classificar as linhas da tabela dinâmica com base nos valores da coluna de pontos :
#sort pivot table by value in 'points' column in descending order
sorted_df_pivot = df_pivot. sort_values (by=[' points '], ascending= False )
#view sorted pivot table
print (sorted_df_pivot)
assist points
team
B 19 26
C 25 23
At 14 18
Observe que as linhas da Tabela Dinâmica agora são classificadas com base nos valores da coluna Pontos .
Observe que se você omitir o argumento ascendente=Falso , as linhas serão classificadas pelos valores na coluna de pontos em ordem crescente:
#sort pivot table by value in 'points' column in ascending order
sorted_df_pivot = df_pivot. sort_values (by=[' points '])
#view sorted pivot table
print (sorted_df_pivot)
assist points
team
At 14 18
C 25 23
B 19 26
Observe que as linhas da tabela dinâmica agora são classificadas pelos valores das colunas de pontos em ordem crescente (do menor para o maior).
Nota nº 1: você também pode classificar várias colunas na tabela dinâmica, passando vários valores para o argumento by na função sort_values() .
Nota nº 2 : você pode encontrar a documentação completa da função pivot_table() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Pandas: Como remodelar o DataFrame de longo para largo
Pandas: Como remodelar o DataFrame de largo para longo
Pandas: como agrupar e agregar em várias colunas