Як використовувати функцію pandas value_counts() (з прикладами)


Ви можете використовувати функцію value_counts() , щоб підрахувати частоту унікальних значень у серії pandas.

Ця функція використовує такий базовий синтаксис:

 my_series. value_counts ()

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклад 1: частота підрахунку унікальних значень

Наступний код показує, як підрахувати випадки унікальних значень у серії pandas:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

Це говорить нам:

  • Значення 3 з’являється 4 рази.
  • Значення 4 з’являється двічі .
  • Значення 7 з’являється двічі .

І так далі.

Приклад 2: частота підрахунку унікальних значень (включаючи NaN)

За замовчуванням функція value_counts() не відображає частоту значень NaN.

Однак ви можете використовувати аргумент dropna для відображення частоти значень NaN:

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

Приклад 3: підрахуйте відносну частоту унікальних значень

Наступний код показує, як використовувати аргумент normalize для підрахунку відносної частоти унікальних значень у серії pandas:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

Це говорить нам:

  • Значення 3 представляє 40% усіх значень у ряді.
  • Значення 4 представляє 20% усіх значень у ряді.
  • Значення 7 становить 20% усіх значень у ряді.

І так далі.

Приклад 4: Частота підрахунку в бункерах

Наступний код показує, як використовувати аргумент bins для підрахунку частоти значень у серії pandas, які потрапляють у контейнери однакового розміру:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

Це говорить нам:

  • Є 6 значень між 3 і 5.
  • Є 2 значення між 5 і 7.
  • Є 2 значення між 7 і 9.

Приклад 5: Підрахуйте частоту значень у Pandas DataFrame

Ми також можемо використовувати функцію value_counts() , щоб обчислити частоту унікальних значень у певному стовпці pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

Додаткові ресурси

У наступних посібниках пояснюється, як використовувати інші поширені функції в pandas:

Як використовувати функцію describe() у Pandas
Як порахувати кількість рядків у Pandas
Як підрахувати групові спостереження панд

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *