Pandas: як знайти унікальні значення в стовпці


Найпростіший спосіб отримати список унікальних значень у стовпці Pandas DataFrame — це використовувати функцію unique() .

Цей підручник містить кілька прикладів використання цієї функції з такими pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A East 10
3 B West 6
4 B West 6
5 C East 5

Знайдіть унікальні значення в стовпці

Наступний код показує, як знайти унікальні значення в одному стовпці DataFrame:

 df. team . single ()

array(['A', 'B', 'C'], dtype=object)

Ми бачимо, що унікальні значення в стовпці team включають «A», «B» і «C».

Знайти унікальні значення у всіх стовпцях

Наступний код показує, як знайти унікальні значення у всіх стовпцях DataFrame:

 for col in df:
  print (df[col] .unique ())

['A' 'B' 'C']
['East' 'West']
[11 8 10 6 5]

Знайдіть і відсортуйте унікальні значення в стовпці

Наступний код показує, як шукати та сортувати за унікальними значеннями в одному стовпці DataFrame:

 #find unique points values
points = df. points . single ()

#sort values smallest to largest
points. sort ()

#display sorted values
points

array([ 5, 6, 8, 10, 11])

Знайдіть і підрахуйте унікальні значення в стовпці

Наступний код показує, як знайти та підрахувати кількість унікальних значень в одному стовпці DataFrame:

 df. team . value_counts ()

At 3
B2
C 1
Name: team, dtype: int64

Додаткові ресурси

Як вибрати окремі рядки в Pandas DataFrame
Як знайти унікальні значення в кількох стовпцях у Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *