Выборочная дисперсия по сравнению с дисперсия населения: в чем разница?


Дисперсия — это способ измерения распределения значений в наборе данных.

Формула для расчета дисперсии генеральной совокупности :

σ 2 = Σ (x i – µ) 2 / N

Золото:

  • Σ : Символ, означающий «сумма».
  • μ : Среднее число населения
  • x i : i- й элемент совокупности
  • N : Численность населения

Формула расчета выборочной дисперсии :

s 2 = Σ (x ix ) 2 / (n-1)

Золото:

  • x : выборочное среднее
  • x i : i элемент выборки
  • n : Размер выборки

Обратите внимание, что между этими двумя формулами есть лишь небольшая разница:

Когда мы рассчитываем дисперсию популяции, мы делим ее на N (размер популяции).

Когда мы рассчитываем выборочную дисперсию, мы делим ее на n-1 (объем выборки – 1).

При расчете выборочной дисперсии мы применяем так называемую поправку Бесселя , которая предполагает деление на n-1.

Не увязая в математических деталях, деление на n-1 может оказаться, что дает несмещенную оценку генеральной дисперсии, которая в любом случае является тем значением, которое нас обычно интересует.

Когда рассчитывать выборочную дисперсию по сравнению с генеральной дисперсией

Если вы не уверены, следует ли рассчитывать выборочную дисперсию или популяционную дисперсию, помните об этом общем правиле:

Вам следует рассчитать дисперсию выборки , если набор данных, с которым вы работаете, представляет собой выборку, взятую из более крупной интересующей совокупности.

Вам следует рассчитывать дисперсию совокупности , если набор данных, с которым вы работаете, представляет всю совокупность, то есть каждое интересующее вас значение.

В следующих примерах показаны различные сценарии расчета выборочной дисперсии и генеральной дисперсии.

Пример: расчет выборочной дисперсии

Предположим, ботаник хочет рассчитать изменение высоты определенного вида растений. Поскольку на участке растут тысячи отдельных растений, она решает взять простую случайную выборку из 20 растений и измерить высоту каждого из них.

В этом сценарии ботаник должен рассчитать дисперсию выборки , поскольку его интересует дисперсия всей популяции растений, но он просто использует эту выборку для оценки истинной дисперсии популяции.

Пример: расчет дисперсии генеральной совокупности

Предположим, учитель хочет вычислить разницу в экзаменационных баллах 20 учеников своего класса.

В этом сценарии учитель должен рассчитать дисперсию генеральной совокупности , поскольку набор данных, с которым он работает (результаты 20 экзаменов), представляет всю интересующую совокупность.

Дополнительные ресурсы

В следующих руководствах объясняется, как рассчитать выборочную дисперсию и популяционную дисперсию в различных статистических программах:

Как рассчитать дисперсию выборки и совокупности в Excel
Как рассчитать дисперсию выборки и совокупности в R
Как рассчитать дисперсию выборки и совокупности в Python

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *