Pandy: jak sortować tabelę przestawną według wartości w kolumnie
Możesz użyć następującej podstawowej składni, aby posortować tabelę przestawną Pandy na podstawie wartości kolumny:
my_pivot_table. sort_values (by=[' some_column '], ascending= False )
Ten konkretny przykład sortuje wartości tabeli przestawnej o nazwie my_pivot_table na podstawie wartości Some_column w kolejności malejącej.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Sortuj tabelę przestawną Pandy według wartości w kolumnie
Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C'], ' points ': [4, 4, 2, 8, 9, 5, 5, 7, 8, 8, 4, 3], ' assists ': [2, 2, 5, 5, 4, 7, 5, 3, 9, 8, 4, 4]}) #view DataFrame print (df) team points assists 0 to 4 2 1 to 4 2 2 to 2 5 3 to 8 5 4 B 9 4 5 B 5 7 6 B 5 5 7 B 7 3 8 C 8 9 9 C 8 8 10 C 4 4 11 C 3 4
Możemy użyć poniższego kodu, aby utworzyć w pandach tabelę przestawną wyświetlającą sumę wartości w punktach i kolumnach pomocniczych dla każdego zespołu:
#create pivot table
df_pivot = df. pivot_table (index=[' team '], values=[' points ', ' assists '], aggfunc=' sum ')
#view pivot table
print (df_pivot)
assist points
team
At 14 18
B 19 26
C 25 23
Domyślnie pandy sortują wiersze tabeli przestawnej alfabetycznie na podstawie wartości kolumny indeksu, która jest kolumną zespołu .
Możemy jednak użyć funkcji sort_values() do posortowania wierszy tabeli przestawnej na podstawie wartości kolumn z kropkami :
#sort pivot table by value in 'points' column in descending order
sorted_df_pivot = df_pivot. sort_values (by=[' points '], ascending= False )
#view sorted pivot table
print (sorted_df_pivot)
assist points
team
B 19 26
C 25 23
At 14 18
Należy pamiętać, że wiersze tabeli przestawnej są teraz sortowane na podstawie wartości w kolumnie Punkty .
Pamiętaj, że jeśli pominiesz argument rosnąco=Fałsz , wiersze zostaną posortowane rosnąco według wartości w kolumnie z kropką :
#sort pivot table by value in 'points' column in ascending order
sorted_df_pivot = df_pivot. sort_values (by=[' points '])
#view sorted pivot table
print (sorted_df_pivot)
assist points
team
At 14 18
C 25 23
B 19 26
Należy pamiętać, że wiersze tabeli przestawnej są teraz sortowane według wartości kolumn z kropkami w kolejności rosnącej (od najmniejszej do największej).
Uwaga nr 1: Możesz także sortować według wielu kolumn w tabeli przestawnej, przekazując wiele wartości do argumentu by w funkcji sort_values() .
Uwaga nr 2 : Pełną dokumentację funkcji obrotowej pandy() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:
Pandy: Jak zmienić kształt DataFrame z długiej na szeroką
Pandy: Jak zmienić kształt ramki danych z szerokiej na długą
Pandy: jak grupować i agregować w wielu kolumnach