Як використовувати функцію pandas value_counts() (з прикладами)
Ви можете використовувати функцію value_counts() , щоб підрахувати частоту унікальних значень у серії pandas.
Ця функція використовує такий базовий синтаксис:
my_series. value_counts ()
Наступні приклади показують, як використовувати цей синтаксис на практиці.
Приклад 1: частота підрахунку унікальних значень
Наступний код показує, як підрахувати випадки унікальних значень у серії pandas:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts () 3 4 4 2 7 2 8 1 9 1 dtype: int64
Це говорить нам:
- Значення 3 з’являється 4 рази.
- Значення 4 з’являється двічі .
- Значення 7 з’являється двічі .
І так далі.
Приклад 2: частота підрахунку унікальних значень (включаючи NaN)
За замовчуванням функція value_counts() не відображає частоту значень NaN.
Однак ви можете використовувати аргумент dropna для відображення частоти значень NaN:
import pandas as pd import numpy as np #create pandas Series with some NaN values my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan]) #count occurrences of unique values in Series, including NaNs my_series. value_counts (dropna= False ) 3.0 4 4.0 2 7.0 2 NaN2 8.0 1 9.0 1 dtype: int64
Приклад 3: підрахуйте відносну частоту унікальних значень
Наступний код показує, як використовувати аргумент normalize для підрахунку відносної частоти унікальних значень у серії pandas:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (normalize= True ) 3 0.4 4 0.2 7 0.2 8 0.1 9 0.1 dtype:float64
Це говорить нам:
- Значення 3 представляє 40% усіх значень у ряді.
- Значення 4 представляє 20% усіх значень у ряді.
- Значення 7 становить 20% усіх значень у ряді.
І так далі.
Приклад 4: Частота підрахунку в бункерах
Наступний код показує, як використовувати аргумент bins для підрахунку частоти значень у серії pandas, які потрапляють у контейнери однакового розміру:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (bins= 3 ) (3.0, 5.0] 6 (5.0, 7.0] 2 (7.0, 9.0] 2 dtype: int64
Це говорить нам:
- Є 6 значень між 3 і 5.
- Є 2 значення між 5 і 7.
- Є 2 значення між 7 і 9.
Приклад 5: Підрахуйте частоту значень у Pandas DataFrame
Ми також можемо використовувати функцію value_counts() , щоб обчислити частоту унікальних значень у певному стовпці pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of unique values in 'points' column df[' points ']. value_counts () 9 3 10 2 13 1 15 1 22 1 Name: points, dtype: int64
Додаткові ресурси
У наступних посібниках пояснюється, як використовувати інші поширені функції в pandas:
Як використовувати функцію describe() у Pandas
Як порахувати кількість рядків у Pandas
Як підрахувати групові спостереження панд