Pandy: sortuj dataframe według indeksu i kolumny
Możesz użyć następującej składni, aby posortować ramkę danych pand według indeksu i kolumny:
df = df. sort_values (by = [' column_name ', ' index '], ascending = [ False , True ])
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykłady: sortuj DataFrame według indeksu i kolumny
Poniższy kod pokazuje, jak posortować ramkę danych pandy według kolumny o nazwie punkty , a następnie według kolumny indeksu :
import pandas as pd #createDataFrame df = pd. DataFrame ({' id ': [1, 2, 3, 4, 5, 6, 7, 8], ' points ': [25, 15, 15, 14, 20, 20, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}). set_index (' id ') #view first few rows df. head () points assists rebounds id 1 25 5 11 2 15 7 8 3 15 7 10 4 14 9 6 5 20 12 6 #sort by points and then by index df. sort_values (by = [' points ', ' id '], ascending = [ False , True ]) points assists rebounds id 8 29 4 12 1 25 5 11 7 25 9 9 5 20 12 6 6 20 9 5 2 15 7 8 3 15 7 10 4 14 9 6
Powstała ramka DataFrame jest sortowana według punktów w kolejności malejącej, a następnie według indeksu w kolejności rosnącej (jeśli jest dwóch graczy, którzy zdobyli tę samą liczbę punktów).
Pamiętaj, że jeśli nie użyjemy argumentu rosnącego , wówczas w każdej kolumnie zostanie zastosowana kolejność rosnąca jako domyślna metoda sortowania:
#sort by points and then by index df. sort_values (by = [' points ', ' id ']) points assists rebounds id 4 14 9 6 2 15 7 8 3 15 7 10 5 20 12 6 6 20 9 5 1 25 5 11 7 25 9 9 8 29 4 12
Jeśli kolumna indeksu nie ma obecnie nazwy, możesz zmienić jej nazwę, a następnie odpowiednio ją posortować:
#sort by points and then by index df. rename_axis (' index '). sort_values (by = [' points ', ' id ']) points assists rebounds id 4 14 9 6 2 15 7 8 3 15 7 10 5 20 12 6 6 20 9 5 1 25 5 11 7 25 9 9 8 29 4 12
Dodatkowe zasoby
Pandy: jak sortować kolumny według nazwy
Pandy: sortuj ramkę danych według daty
Pandy: Jak usunąć zduplikowane wiersze