Как рассчитать дисперсию выборки и совокупности в python


Дисперсия — это способ измерения распределения значений в наборе данных.

Формула для расчета дисперсии генеральной совокупности :

σ 2 = Σ (x i – µ) 2 / N

Золото:

  • Σ : Символ, означающий «сумма».
  • μ : Среднее число населения
  • x i : i- й элемент совокупности
  • N : Численность населения

Формула расчета выборочной дисперсии :

s 2 = Σ (x ix ) 2 / (n-1)

Золото:

  • x : образец означает
  • x i : i элемент выборки
  • n : Размер выборки

Мы можем использовать функции дисперсии и pvariance из библиотеки статистики Python, чтобы быстро вычислить выборочную дисперсию и дисперсию генеральной совокупности (соответственно) для данной таблицы.

 from statistics import variance, pvariance

#calculate sample variance
variance(s)

#calculate population variance
pvariance(x)

Следующие примеры показывают, как использовать каждую функцию на практике.

Пример 1. Расчет выборочной дисперсии в Python

Следующий код показывает, как вычислить выборочную дисперсию таблицы в Python:

 from statistics import variance 

#define data
data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14]

#calculate sample variance
variance(data)

22,067

Выборочная дисперсия оказывается равной 22,067 .

Пример 2. Расчет дисперсии совокупности в Python

Следующий код показывает, как вычислить дисперсию совокупности таблицы в Python:

 from statistics import pvariance 

#define data
data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14]

#calculate sample variance
pvariance(data)

20,596

Дисперсия населения оказывается равной 20 596 .

Примечания по расчету выборочной и генеральной дисперсии

При расчете выборочной и генеральной дисперсии имейте в виду следующее:

  • Вам следует рассчитывать дисперсию совокупности , если набор данных, с которым вы работаете, представляет всю совокупность, то есть каждое интересующее вас значение.
  • Вам следует рассчитать дисперсию выборки , если набор данных, с которым вы работаете, представляет собой выборку, взятую из более крупной интересующей совокупности.
  • Выборочная дисперсия данной таблицы данных всегда будет больше, чем генеральная дисперсия для той же таблицы данных, поскольку при расчете выборочной дисперсии существует большая неопределенность, поэтому наша оценка дисперсии будет больше.

Дополнительные ресурсы

В следующих руководствах объясняется, как рассчитать другие показатели спреда в Python:

Как рассчитать межквартильный размах в Python
Как рассчитать коэффициент вариации в Python
Как рассчитать стандартное отклонение списка в Python

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *