Pandas: как найти уникальные значения в столбце
Самый простой способ получить список уникальных значений в столбце Pandas DataFrame — использовать функцию unique() .
В этом руководстве представлено несколько примеров использования этой функции со следующим DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
Найдите уникальные значения в столбце
Следующий код показывает, как найти уникальные значения в одном столбце DataFrame:
df. team . single () array(['A', 'B', 'C'], dtype=object)
Мы видим, что уникальные значения в столбце команды включают «A», «B» и «C».
Найдите уникальные значения во всех столбцах
Следующий код показывает, как найти уникальные значения во всех столбцах DataFrame:
for col in df: print (df[col] .unique ()) ['A' 'B' 'C'] ['East' 'West'] [11 8 10 6 5]
Найдите и отсортируйте уникальные значения в столбце
Следующий код показывает, как выполнять поиск и сортировку по уникальным значениям в одном столбце DataFrame:
#find unique points values points = df. points . single () #sort values smallest to largest points. sort () #display sorted values points array([ 5, 6, 8, 10, 11])
Найдите и подсчитайте уникальные значения в столбце
Следующий код показывает, как найти и подсчитать появление уникальных значений в одном столбце DataFrame:
df. team . value_counts () At 3 B2 C 1 Name: team, dtype: int64
Дополнительные ресурсы
Как выбрать отдельные строки в DataFrame Pandas
Как найти уникальные значения в нескольких столбцах в Pandas