Pandas: відсортуйте dataframe за індексом і стовпцем
Ви можете використовувати такий синтаксис, щоб сортувати pandas DataFrame за індексом і стовпцем:
df = df. sort_values (by = [' column_name ', ' index '], ascending = [ False , True ])
Наступні приклади показують, як використовувати цей синтаксис на практиці.
Приклади: сортування DataFrame за індексом і стовпцем
Наступний код показує, як сортувати pandas DataFrame за стовпцем під назвою points , а потім за стовпцем індексу :
import pandas as pd #createDataFrame df = pd. DataFrame ({' id ': [1, 2, 3, 4, 5, 6, 7, 8], ' points ': [25, 15, 15, 14, 20, 20, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}). set_index (' id ') #view first few rows df. head () points assists rebounds id 1 25 5 11 2 15 7 8 3 15 7 10 4 14 9 6 5 20 12 6 #sort by points and then by index df. sort_values (by = [' points ', ' id '], ascending = [ False , True ]) points assists rebounds id 8 29 4 12 1 25 5 11 7 25 9 9 5 20 12 6 6 20 9 5 2 15 7 8 3 15 7 10 4 14 9 6
Отриманий DataFrame сортується за очками в порядку спадання, а потім за індексом у порядку зростання (якщо є два гравці, які набрали однакову кількість очок).
Зауважте, що якщо ми не використовуємо аргумент за зростанням , тоді кожен стовпець використовуватиме порядок за зростанням як метод сортування за замовчуванням:
#sort by points and then by index df. sort_values (by = [' points ', ' id ']) points assists rebounds id 4 14 9 6 2 15 7 8 3 15 7 10 5 20 12 6 6 20 9 5 1 25 5 11 7 25 9 9 8 29 4 12
Якщо стовпець індексу наразі не має назви, ви можете перейменувати його, а потім відсортувати відповідно:
#sort by points and then by index df. rename_axis (' index '). sort_values (by = [' points ', ' id ']) points assists rebounds id 4 14 9 6 2 15 7 8 3 15 7 10 5 20 12 6 6 20 9 5 1 25 5 11 7 25 9 9 8 29 4 12
Додаткові ресурси
Pandas: як сортувати стовпці за назвою
Pandas: відсортуйте DataFrame за датою
Pandas: як видалити повторювані рядки