Pandas: відсортуйте dataframe за індексом і стовпцем


Ви можете використовувати такий синтаксис, щоб сортувати pandas DataFrame за індексом і стовпцем:

 df = df. sort_values (by = [' column_name ', ' index '], ascending = [ False , True ])

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклади: сортування DataFrame за індексом і стовпцем

Наступний код показує, як сортувати pandas DataFrame за стовпцем під назвою points , а потім за стовпцем індексу :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' id ': [1, 2, 3, 4, 5, 6, 7, 8],
                   ' points ': [25, 15, 15, 14, 20, 20, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}). set_index (' id ')

#view first few rows
df. head ()

	points assists rebounds
id			
1 25 5 11
2 15 7 8
3 15 7 10
4 14 9 6
5 20 12 6

#sort by points and then by index
df. sort_values (by = [' points ', ' id '], ascending = [ False , True ])

	points assists rebounds
id			
8 29 4 12
1 25 5 11
7 25 9 9
5 20 12 6
6 20 9 5
2 15 7 8
3 15 7 10
4 14 9 6

Отриманий DataFrame сортується за очками в порядку спадання, а потім за індексом у порядку зростання (якщо є два гравці, які набрали однакову кількість очок).

Зауважте, що якщо ми не використовуємо аргумент за зростанням , тоді кожен стовпець використовуватиме порядок за зростанням як метод сортування за замовчуванням:

 #sort by points and then by index
df. sort_values (by = [' points ', ' id '])

        points assists rebounds
id			
4 14 9 6
2 15 7 8
3 15 7 10
5 20 12 6
6 20 9 5
1 25 5 11
7 25 9 9
8 29 4 12

Якщо стовпець індексу наразі не має назви, ви можете перейменувати його, а потім відсортувати відповідно:

 #sort by points and then by index
df. rename_axis (' index '). sort_values (by = [' points ', ' id '])

        points assists rebounds
id			
4 14 9 6
2 15 7 8
3 15 7 10
5 20 12 6
6 20 9 5
1 25 5 11
7 25 9 9
8 29 4 12

Додаткові ресурси

Pandas: як сортувати стовпці за назвою
Pandas: відсортуйте DataFrame за датою
Pandas: як видалити повторювані рядки

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *