Панды: найдите уникальные значения в столбце и отсортируйте их
Вы можете использовать следующий базовый синтаксис, чтобы найти уникальные значения в столбце DataFrame pandas, а затем отсортировать их:
df[' my_column ']. drop_duplicates (). sort_values ()
Это вернет серию pandas, содержащую каждое уникальное значение в столбце, отсортированном в порядке возрастания.
Чтобы отсортировать уникальные значения в порядке убывания, используйте возрастающий=False :
df[' my_column ']. drop_duplicates (). sort_values (ascending= False )
В следующем примере показано, как использовать этот синтаксис на практике.
Пример. Найдите уникальные значения в столбце Pandas и отсортируйте их.
Предположим, у нас есть следующий DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' points ': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]}) #view DataFrame print (df) team points 0 to 5 1 to 5 2 to 9 3 to 12 4 to 12 5 B 5 6 B 10 7 B 13 8 B 13 9 B 19
Мы можем использовать следующий синтаксис, чтобы получить уникальные значения столбца точек , а затем отсортировать их по возрастанию:
#get unique values in points column and sort them
df[' points ']. drop_duplicates (). sort_values ()
0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64
На выходе отображаются каждое из уникальных значений в столбце точек , отсортированных в порядке возрастания:
- 5
- 9
- десять
- 12
- 13
- 19
Мы также можем получить уникальные значения в столбце точек, отсортированные в порядке убывания, указав возрастание=False в функции sort_values() :
#get unique values in points column and sort them in descending order
df[' points ']. drop_duplicates (). sort_values (ascending= False )
9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64
На выходе отображаются каждое из уникальных значений в столбце точек , отсортированное в порядке убывания:
- 19
- 13
- 12
- десять
- 9
- 5
Примечание . Полную документацию по функции pandas drop_duplications() можно найти здесь.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные функции в pandas:
Pandas: как выбрать отдельные строки в DataFrame
Pandas: как получить уникальные значения из индексного столбца
Панды: как посчитать уникальные комбинации двух столбцов