Pandas: como classificar a tabela dinâmica por valores na coluna


Você pode usar a seguinte sintaxe básica para classificar uma tabela dinâmica do pandas com base nos valores de uma coluna:

 my_pivot_table. sort_values (by=[' some_column '], ascending= False )

Este exemplo específico classifica os valores de uma tabela dinâmica chamada my_pivot_table com base nos valores de some_column em ordem decrescente.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Classifique a tabela dinâmica do Pandas por valores na coluna

Suponha que temos o seguinte DataFrame do pandas que contém informações sobre vários jogadores de basquete:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Podemos usar o código a seguir para criar uma tabela dinâmica no pandas que exibe a soma dos valores nas colunas de pontos e assistência de cada equipe:

 #create pivot table
df_pivot = df. pivot_table (index=[' team '], values=[' points ', ' assists '], aggfunc=' sum ')

#view pivot table
print (df_pivot)

      assist points
team                 
At 14 18
B 19 26
C 25 23

Por padrão, o pandas classifica as linhas da tabela dinâmica em ordem alfabética com base no valor da coluna do índice, que é a coluna da equipe .

No entanto, podemos usar a função sort_values() para classificar as linhas da tabela dinâmica com base nos valores da coluna de pontos :

 #sort pivot table by value in 'points' column in descending order
sorted_df_pivot = df_pivot. sort_values (by=[' points '], ascending= False )

#view sorted pivot table
print (sorted_df_pivot)

      assist points
team                 
B 19 26
C 25 23
At 14 18

Observe que as linhas da Tabela Dinâmica agora são classificadas com base nos valores da coluna Pontos .

Observe que se você omitir o argumento ascendente=Falso , as linhas serão classificadas pelos valores na coluna de pontos em ordem crescente:

 #sort pivot table by value in 'points' column in ascending order
sorted_df_pivot = df_pivot. sort_values (by=[' points '])

#view sorted pivot table
print (sorted_df_pivot)

      assist points
team                 
At 14 18
C 25 23
B 19 26

Observe que as linhas da tabela dinâmica agora são classificadas pelos valores das colunas de pontos em ordem crescente (do menor para o maior).

Nota nº 1: você também pode classificar várias colunas na tabela dinâmica, passando vários valores para o argumento by na função sort_values() .

Nota nº 2 : você pode encontrar a documentação completa da função pivot_table() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Pandas: Como remodelar o DataFrame de longo para largo
Pandas: Como remodelar o DataFrame de largo para longo
Pandas: como agrupar e agregar em várias colunas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *