Выборочная дисперсия по сравнению с дисперсия населения: в чем разница?
Дисперсия — это способ измерения распределения значений в наборе данных.
Формула для расчета дисперсии генеральной совокупности :
σ 2 = Σ (x i – µ) 2 / N
Золото:
- Σ : Символ, означающий «сумма».
- μ : Среднее число населения
- x i : i- й элемент совокупности
- N : Численность населения
Формула расчета выборочной дисперсии :
s 2 = Σ (x i – x ) 2 / (n-1)
Золото:
- x : выборочное среднее
- x i : i -й элемент выборки
- n : Размер выборки
Обратите внимание, что между этими двумя формулами есть лишь небольшая разница:
Когда мы рассчитываем дисперсию популяции, мы делим ее на N (размер популяции).
Когда мы рассчитываем выборочную дисперсию, мы делим ее на n-1 (объем выборки – 1).
При расчете выборочной дисперсии мы применяем так называемую поправку Бесселя , которая предполагает деление на n-1.
Не увязая в математических деталях, деление на n-1 может оказаться, что дает несмещенную оценку генеральной дисперсии, которая в любом случае является тем значением, которое нас обычно интересует.
Когда рассчитывать выборочную дисперсию по сравнению с генеральной дисперсией
Если вы не уверены, следует ли рассчитывать выборочную дисперсию или популяционную дисперсию, помните об этом общем правиле:
Вам следует рассчитать дисперсию выборки , если набор данных, с которым вы работаете, представляет собой выборку, взятую из более крупной интересующей совокупности.
Вам следует рассчитывать дисперсию совокупности , если набор данных, с которым вы работаете, представляет всю совокупность, то есть каждое интересующее вас значение.
В следующих примерах показаны различные сценарии расчета выборочной дисперсии и генеральной дисперсии.
Пример: расчет выборочной дисперсии
Предположим, ботаник хочет рассчитать изменение высоты определенного вида растений. Поскольку на участке растут тысячи отдельных растений, она решает взять простую случайную выборку из 20 растений и измерить высоту каждого из них.
В этом сценарии ботаник должен рассчитать дисперсию выборки , поскольку его интересует дисперсия всей популяции растений, но он просто использует эту выборку для оценки истинной дисперсии популяции.
Пример: расчет дисперсии генеральной совокупности
Предположим, учитель хочет вычислить разницу в экзаменационных баллах 20 учеников своего класса.
В этом сценарии учитель должен рассчитать дисперсию генеральной совокупности , поскольку набор данных, с которым он работает (результаты 20 экзаменов), представляет всю интересующую совокупность.
Дополнительные ресурсы
В следующих руководствах объясняется, как рассчитать выборочную дисперсию и популяционную дисперсию в различных статистических программах:
Как рассчитать дисперсию выборки и совокупности в Excel
Как рассчитать дисперсию выборки и совокупности в R
Как рассчитать дисперсию выборки и совокупности в Python