Дисперсія вибірки проти розбіжність населення: у чому різниця?

за Редакція 23 Липня, 2023 Гід 0 коментарів

Дисперсія – це спосіб вимірювання розподілу значень у наборі даних.

Формула для обчислення дисперсії сукупності :

σ ² = Σ (x _i – μ) ² / N

золото:

Σ : символ, що означає «сума»
μ : середня чисельність населення
x _i : i- ^й елемент сукупності
N : чисельність населення

Формула для розрахунку дисперсії вибірки :

s ² = Σ (x _i – x ) ² / (n-1)

золото:

x : вибірка середніх
x _i : i- ^й елемент вибірки
n : розмір вибірки

Зауважте, що між двома формулами є лише невелика різниця:

Коли ми обчислюємо дисперсію сукупності, ми ділимо на N (розмір генеральної сукупності).

Коли ми обчислюємо дисперсію вибірки, ми ділимо на n-1 (розмір вибірки – 1).

Під час обчислення вибіркової дисперсії ми застосовуємо так звану поправку Бесселя , яка передбачає ділення на n-1.

Не занурюючись у математичні деталі, ділення на n-1 може виявитися джерелом неупередженої оцінки дисперсії генеральної сукупності, яка є значенням, яке нас зазвичай цікавить.

Коли обчислювати дисперсію вибірки проти дисперсії сукупності

Якщо ви не впевнені, чи обчислювати дисперсію вибірки чи дисперсію сукупності, пам’ятайте про це загальне правило:

Варто розрахувати дисперсію вибірки , коли набір даних, з яким ви працюєте, представляє вибірку, взяту з більшої сукупності, що вас цікавить.

Варто обчислити дисперсію сукупності , коли набір даних, з яким ви працюєте, представляє всю сукупність, тобто кожне значення, яке вас цікавить.

У наведених нижче прикладах показано різні сценарії обчислення дисперсії вибірки та дисперсії генеральної сукупності.

Приклад: обчислення дисперсії вибірки

Припустимо, ботанік хоче обчислити коливання висоти певного виду рослин. Оскільки на території є тисячі окремих рослин, вона вирішує взяти просту випадкову вибірку з 20 рослин і виміряти висоту кожної з них.

У цьому сценарії ботанік повинен обчислити дисперсію вибірки , оскільки його цікавить дисперсія всієї популяції рослин, але він просто використовує цю вибірку для оцінки справжньої дисперсії популяції.

Приклад: обчислення дисперсії сукупності

Припустімо, що вчитель хоче підрахувати дисперсію екзаменаційних балів 20 учнів його класу.

У цьому сценарії вчитель повинен обчислити дисперсію генеральної сукупності , оскільки набір даних, з яким він працює (20 результатів іспитів), представляє всю сукупність, що цікавить.

Додаткові ресурси

У наступних посібниках пояснюється, як обчислити дисперсію вибірки та дисперсію генеральної сукупності в різних статистичних програмах:

Як обчислити дисперсію вибірки та сукупності в Excel
Як обчислити дисперсію вибірки та сукупності в R
Як розрахувати дисперсію вибірки та сукупності в Python

Про автора

Редакція

Привіт, я Бенджамін, професор статистики на пенсії, який став викладачем статистики. Маючи великий досвід і знання в галузі статистики, я готовий поділитися своїми знаннями, щоб розширити можливості студентів через Statorials. Дізнайтеся більше