Pandas: як знайти унікальні значення в стовпці
Найпростіший спосіб отримати список унікальних значень у стовпці Pandas DataFrame — це використовувати функцію unique() .
Цей підручник містить кілька прикладів використання цієї функції з такими pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
Знайдіть унікальні значення в стовпці
Наступний код показує, як знайти унікальні значення в одному стовпці DataFrame:
df. team . single () array(['A', 'B', 'C'], dtype=object)
Ми бачимо, що унікальні значення в стовпці team включають «A», «B» і «C».
Знайти унікальні значення у всіх стовпцях
Наступний код показує, як знайти унікальні значення у всіх стовпцях DataFrame:
for col in df: print (df[col] .unique ()) ['A' 'B' 'C'] ['East' 'West'] [11 8 10 6 5]
Знайдіть і відсортуйте унікальні значення в стовпці
Наступний код показує, як шукати та сортувати за унікальними значеннями в одному стовпці DataFrame:
#find unique points values points = df. points . single () #sort values smallest to largest points. sort () #display sorted values points array([ 5, 6, 8, 10, 11])
Знайдіть і підрахуйте унікальні значення в стовпці
Наступний код показує, як знайти та підрахувати кількість унікальних значень в одному стовпці DataFrame:
df. team . value_counts () At 3 B2 C 1 Name: team, dtype: int64
Додаткові ресурси
Як вибрати окремі рядки в Pandas DataFrame
Як знайти унікальні значення в кількох стовпцях у Pandas