Панды: найдите уникальные значения в столбце и отсортируйте их


Вы можете использовать следующий базовый синтаксис, чтобы найти уникальные значения в столбце DataFrame pandas, а затем отсортировать их:

 df[' my_column ']. drop_duplicates (). sort_values ()

Это вернет серию pandas, содержащую каждое уникальное значение в столбце, отсортированном в порядке возрастания.

Чтобы отсортировать уникальные значения в порядке убывания, используйте возрастающий=False :

 df[' my_column ']. drop_duplicates (). sort_values (ascending= False )

В следующем примере показано, как использовать этот синтаксис на практике.

Пример. Найдите уникальные значения в столбце Pandas и отсортируйте их.

Предположим, у нас есть следующий DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]})

#view DataFrame
print (df)

  team points
0 to 5
1 to 5
2 to 9
3 to 12
4 to 12
5 B 5
6 B 10
7 B 13
8 B 13
9 B 19

Мы можем использовать следующий синтаксис, чтобы получить уникальные значения столбца точек , а затем отсортировать их по возрастанию:

 #get unique values in points column and sort them
df[' points ']. drop_duplicates (). sort_values ()

0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64

На выходе отображаются каждое из уникальных значений в столбце точек , отсортированных в порядке возрастания:

  • 5
  • 9
  • десять
  • 12
  • 13
  • 19

Мы также можем получить уникальные значения в столбце точек, отсортированные в порядке убывания, указав возрастание=False в функции sort_values() :

 #get unique values in points column and sort them in descending order
df[' points ']. drop_duplicates (). sort_values (ascending= False )

9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64

На выходе отображаются каждое из уникальных значений в столбце точек , отсортированное в порядке убывания:

  • 19
  • 13
  • 12
  • десять
  • 9
  • 5

Примечание . Полную документацию по функции pandas drop_duplications() можно найти здесь.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные функции в pandas:

Pandas: как выбрать отдельные строки в DataFrame
Pandas: как получить уникальные значения из индексного столбца
Панды: как посчитать уникальные комбинации двух столбцов

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *