Дисперсія вибірки проти розбіжність населення: у чому різниця?


Дисперсія – це спосіб вимірювання розподілу значень у наборі даних.

Формула для обчислення дисперсії сукупності :

σ 2 = Σ (x i – μ) 2 / N

золото:

  • Σ : символ, що означає «сума»
  • μ : середня чисельність населення
  • x i : i- й елемент сукупності
  • N : чисельність населення

Формула для розрахунку дисперсії вибірки :

s 2 = Σ (x ix ) 2 / (n-1)

золото:

  • x : вибірка середніх
  • x i : i- й елемент вибірки
  • n : розмір вибірки

Зауважте, що між двома формулами є лише невелика різниця:

Коли ми обчислюємо дисперсію сукупності, ми ділимо на N (розмір генеральної сукупності).

Коли ми обчислюємо дисперсію вибірки, ми ділимо на n-1 (розмір вибірки – 1).

Під час обчислення вибіркової дисперсії ми застосовуємо так звану поправку Бесселя , яка передбачає ділення на n-1.

Не занурюючись у математичні деталі, ділення на n-1 може виявитися джерелом неупередженої оцінки дисперсії генеральної сукупності, яка є значенням, яке нас зазвичай цікавить.

Коли обчислювати дисперсію вибірки проти дисперсії сукупності

Якщо ви не впевнені, чи обчислювати дисперсію вибірки чи дисперсію сукупності, пам’ятайте про це загальне правило:

Варто розрахувати дисперсію вибірки , коли набір даних, з яким ви працюєте, представляє вибірку, взяту з більшої сукупності, що вас цікавить.

Варто обчислити дисперсію сукупності , коли набір даних, з яким ви працюєте, представляє всю сукупність, тобто кожне значення, яке вас цікавить.

У наведених нижче прикладах показано різні сценарії обчислення дисперсії вибірки та дисперсії генеральної сукупності.

Приклад: обчислення дисперсії вибірки

Припустимо, ботанік хоче обчислити коливання висоти певного виду рослин. Оскільки на території є тисячі окремих рослин, вона вирішує взяти просту випадкову вибірку з 20 рослин і виміряти висоту кожної з них.

У цьому сценарії ботанік повинен обчислити дисперсію вибірки , оскільки його цікавить дисперсія всієї популяції рослин, але він просто використовує цю вибірку для оцінки справжньої дисперсії популяції.

Приклад: обчислення дисперсії сукупності

Припустімо, що вчитель хоче підрахувати дисперсію екзаменаційних балів 20 учнів його класу.

У цьому сценарії вчитель повинен обчислити дисперсію генеральної сукупності , оскільки набір даних, з яким він працює (20 результатів іспитів), представляє всю сукупність, що цікавить.

Додаткові ресурси

У наступних посібниках пояснюється, як обчислити дисперсію вибірки та дисперсію генеральної сукупності в різних статистичних програмах:

Як обчислити дисперсію вибірки та сукупності в Excel
Як обчислити дисперсію вибірки та сукупності в R
Як розрахувати дисперсію вибірки та сукупності в Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *