Дисперсія вибірки проти розбіжність населення: у чому різниця?
Дисперсія – це спосіб вимірювання розподілу значень у наборі даних.
Формула для обчислення дисперсії сукупності :
σ 2 = Σ (x i – μ) 2 / N
золото:
- Σ : символ, що означає «сума»
- μ : середня чисельність населення
- x i : i- й елемент сукупності
- N : чисельність населення
Формула для розрахунку дисперсії вибірки :
s 2 = Σ (x i – x ) 2 / (n-1)
золото:
- x : вибірка середніх
- x i : i- й елемент вибірки
- n : розмір вибірки
Зауважте, що між двома формулами є лише невелика різниця:
Коли ми обчислюємо дисперсію сукупності, ми ділимо на N (розмір генеральної сукупності).
Коли ми обчислюємо дисперсію вибірки, ми ділимо на n-1 (розмір вибірки – 1).
Під час обчислення вибіркової дисперсії ми застосовуємо так звану поправку Бесселя , яка передбачає ділення на n-1.
Не занурюючись у математичні деталі, ділення на n-1 може виявитися джерелом неупередженої оцінки дисперсії генеральної сукупності, яка є значенням, яке нас зазвичай цікавить.
Коли обчислювати дисперсію вибірки проти дисперсії сукупності
Якщо ви не впевнені, чи обчислювати дисперсію вибірки чи дисперсію сукупності, пам’ятайте про це загальне правило:
Варто розрахувати дисперсію вибірки , коли набір даних, з яким ви працюєте, представляє вибірку, взяту з більшої сукупності, що вас цікавить.
Варто обчислити дисперсію сукупності , коли набір даних, з яким ви працюєте, представляє всю сукупність, тобто кожне значення, яке вас цікавить.
У наведених нижче прикладах показано різні сценарії обчислення дисперсії вибірки та дисперсії генеральної сукупності.
Приклад: обчислення дисперсії вибірки
Припустимо, ботанік хоче обчислити коливання висоти певного виду рослин. Оскільки на території є тисячі окремих рослин, вона вирішує взяти просту випадкову вибірку з 20 рослин і виміряти висоту кожної з них.

У цьому сценарії ботанік повинен обчислити дисперсію вибірки , оскільки його цікавить дисперсія всієї популяції рослин, але він просто використовує цю вибірку для оцінки справжньої дисперсії популяції.
Приклад: обчислення дисперсії сукупності
Припустімо, що вчитель хоче підрахувати дисперсію екзаменаційних балів 20 учнів його класу.

У цьому сценарії вчитель повинен обчислити дисперсію генеральної сукупності , оскільки набір даних, з яким він працює (20 результатів іспитів), представляє всю сукупність, що цікавить.
Додаткові ресурси
У наступних посібниках пояснюється, як обчислити дисперсію вибірки та дисперсію генеральної сукупності в різних статистичних програмах:
Як обчислити дисперсію вибірки та сукупності в Excel
Як обчислити дисперсію вибірки та сукупності в R
Як розрахувати дисперсію вибірки та сукупності в Python