Як порахувати унікальні значення в пандах: з прикладами


Ви можете використовувати функцію nunique() , щоб підрахувати кількість унікальних значень у pandas DataFrame.

Ця функція використовує такий базовий синтаксис:

 #count unique values in each column
df. nunique ()

#count unique values in each row
df. nunique (axis= 1 )

Наступні приклади показують, як використовувати цю функцію на практиці з такими pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [8, 8, 13, 13, 22, 22, 25, 29],
                   ' assists ': [5, 8, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 11, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 8 5 11
1 To 8 8 8
2 to 13 7 11
3 A 13 9 6
4 B 22 12 6
5 B 22 9 5
6 B 25 9 9
7 B 29 4 12

Приклад 1: Підрахуйте унікальні значення в кожному стовпці

Наступний код показує, як підрахувати кількість унікальних значень у кожному стовпці DataFrame:

 #count unique values in each column
df. nunique ()

team 2
points 5
assists 5
rebounds 6
dtype: int64

З результату ми бачимо:

  • Стовпець «команда» має 2 унікальних значення
  • Стовпець «балів» має 5 унікальних значень
  • Стовпець «допомога» має 5 унікальних значень
  • Стовпець «підбирання» містить 6 унікальних значень

Приклад 2: підрахувати унікальні значення в кожному рядку

Наступний код показує, як підрахувати кількість унікальних значень у кожному рядку DataFrame:

 #count unique values in each row
df. nunique (axis= 1 )

0 4
1 2
2 4
3 4
4 4
5 4
6 3
7 4
dtype: int64

З результату ми бачимо:

  • Перший рядок має 4 унікальних значення
  • Другий рядок має 2 унікальних значення
  • Третій рядок має 4 унікальних значення

І так далі.

Приклад 3: Підрахунок унікальних значень на групу

Наступний код показує, як підрахувати кількість унікальних значень на групу в DataFrame:

 #count unique 'points' values, grouped by team
df. groupby (' team ')[' points ']. nunique ()

team
At 2
B 3
Name: points, dtype: int64

З результату ми бачимо:

  • Команда «А» має 2 унікальних значення «очки».
  • Команда «B» має 3 унікальних значення «очки».

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:

Як підрахувати групові спостереження панд
Як порахувати пропущені значення в пандах
Як використовувати функцію Pandas value_counts().

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *