Pandy: jak sortować tabelę przestawną według wartości w kolumnie


Możesz użyć następującej podstawowej składni, aby posortować tabelę przestawną Pandy na podstawie wartości kolumny:

 my_pivot_table. sort_values (by=[' some_column '], ascending= False )

Ten konkretny przykład sortuje wartości tabeli przestawnej o nazwie my_pivot_table na podstawie wartości Some_column w kolejności malejącej.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Sortuj tabelę przestawną Pandy według wartości w kolumnie

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C'],
                   ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3],
                   ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]})

#view DataFrame
print (df)

   team points assists
0 to 4 2
1 to 4 2
2 to 2 5
3 to 8 5
4 B 9 4
5 B 5 7
6 B 5 5
7 B 7 3
8 C 8 9
9 C 8 8
10 C 4 4
11 C 3 4

Możemy użyć poniższego kodu, aby utworzyć w pandach tabelę przestawną wyświetlającą sumę wartości w punktach i kolumnach pomocniczych dla każdego zespołu:

 #create pivot table
df_pivot = df. pivot_table (index=[' team '], values=[' points ', ' assists '], aggfunc=' sum ')

#view pivot table
print (df_pivot)

      assist points
team                 
At 14 18
B 19 26
C 25 23

Domyślnie pandy sortują wiersze tabeli przestawnej alfabetycznie na podstawie wartości kolumny indeksu, która jest kolumną zespołu .

Możemy jednak użyć funkcji sort_values() do posortowania wierszy tabeli przestawnej na podstawie wartości kolumn z kropkami :

 #sort pivot table by value in 'points' column in descending order
sorted_df_pivot = df_pivot. sort_values (by=[' points '], ascending= False )

#view sorted pivot table
print (sorted_df_pivot)

      assist points
team                 
B 19 26
C 25 23
At 14 18

Należy pamiętać, że wiersze tabeli przestawnej są teraz sortowane na podstawie wartości w kolumnie Punkty .

Pamiętaj, że jeśli pominiesz argument rosnąco=Fałsz , wiersze zostaną posortowane rosnąco według wartości w kolumnie z kropką :

 #sort pivot table by value in 'points' column in ascending order
sorted_df_pivot = df_pivot. sort_values (by=[' points '])

#view sorted pivot table
print (sorted_df_pivot)

      assist points
team                 
At 14 18
C 25 23
B 19 26

Należy pamiętać, że wiersze tabeli przestawnej są teraz sortowane według wartości kolumn z kropkami w kolejności rosnącej (od najmniejszej do największej).

Uwaga nr 1: Możesz także sortować według wielu kolumn w tabeli przestawnej, przekazując wiele wartości do argumentu by w funkcji sort_values() .

Uwaga nr 2 : Pełną dokumentację funkcji obrotowej pandy() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Pandy: Jak zmienić kształt DataFrame z długiej na szeroką
Pandy: Jak zmienić kształt ramki danych z szerokiej na długą
Pandy: jak grupować i agregować w wielu kolumnach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *