Як обчислити відносну частоту в python
Відносна частота вимірює, як часто певне значення з’являється в наборі даних відносно загальної кількості значень у наборі даних.
Ви можете використовувати таку функцію в Python для обчислення відносних частот:
def rel_freq (x): freqs = [(value, x.count(value) / len(x)) for value in set(x)] return freqs
Наступні приклади показують, як використовувати цю функцію на практиці.
Приклад 1: Відносні частоти для списку чисел
Наступний код показує, як використовувати цю функцію для обчислення відносних частот списку чисел:
#define data data = [1, 1, 1, 2, 3, 4, 4] #calculate relative frequencies for each value in list rel_freq(data) [(1, 0.42857142857142855), (2, 0.14285714285714285), (3, 0.14285714285714285), (4, 0.2857142857142857)]
Спосіб інтерпретації цього результату:
- Значення «1» має відносну частоту 0,42857 у наборі даних.
- Значення «2» має відносну частоту 0,142857 у наборі даних.
- Значення «3» має відносну частоту 0,142857 у наборі даних.
- Значення «4» має відносну частоту 0,28571 у наборі даних.
Ви помітите, що всі відносні частоти в сумі дорівнюють 1.
Приклад 2: Відносні частоти для списку символів
Наступний код показує, як використовувати цю функцію для обчислення відносної частоти списку символів:
#define data data = ['a', 'a', 'b', 'b', 'c'] #calculate relative frequencies for each value in list rel_freq(data) [('a', 0.4), ('b', 0.4), ('c', 0.2)]
Спосіб інтерпретації цього результату:
- Значення «a» має відносну частоту 0,4 у наборі даних.
- Значення «b» має відносну частоту 0,4 у наборі даних.
- Значення «c» має відносну частоту 0,2 у наборі даних.
Знову ж таки, усі відносні частоти в сумі дають 1.
Приклад 3: відносні частоти для стовпця у pandas DataFrame
Наступний код показує, як використовувати цю функцію для обчислення відносних частот для певного стовпця в pandas DataFrame:
import pandas as pd #define data data = pd.DataFrame({'A': [25, 15, 15, 14, 19], 'B': [5, 7, 7, 9, 12], 'C': [11, 8, 10, 6, 6]}) #calculate relative frequencies of values in column 'A' rel_freq( list (data['A'])) [(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]
Спосіб інтерпретації цього результату:
- Значення «25» має відносну частоту 0,2 у стовпці.
- Значення «19» має відносну частоту 0,2 у стовпці.
- Значення «14» має відносну частоту 0,2 у стовпці.
- Значення «15» має відносну частоту 0,4 у стовпці.
Знову ж таки, усі відносні частоти в сумі дають 1.
Додаткові ресурси
Калькулятор відносної частоти
Гістограма відносної частоти: визначення + приклад
Як обчислити відносну частоту в Excel