Var.p проти var.s в excel: у чому різниця?
Для обчислення дисперсії в Excel можна використовувати три різні функції:
1. VAR.P: Ця функція обчислює дисперсію сукупності. Використовуйте цю функцію, коли діапазон значень представляє всю сукупність.
Ця функція використовує таку формулу:
Дисперсія популяції = Σ(x i – μ) 2 / N
золото:
- Σ: грецький символ, що означає «сума»
- x i : i-те значення набору даних
- μ: середня популяція
- N: Загальна кількість спостережень
2. VAR.S: Ця функція обчислює дисперсію вибірки. Використовуйте цю функцію, коли діапазон значень представляє вибірку значень, а не всю сукупність.
Ця функція використовує таку формулу:
Дисперсія вибірки = Σ(x i – x ) 2 / (n-1)
золото:
- Σ: грецький символ, що означає «сума»
- x i : i-те значення набору даних
- x : вибірка означає
- N: Загальна кількість спостережень
3. VAR: Ця функція також обчислює дисперсію вибірки. Вона поверне те саме значення, що й функція VAR.S.
Технічна примітка:
Оскільки формула для дисперсії сукупності ділиться на N замість n-1 , дисперсія генеральної сукупності завжди буде меншою, ніж дисперсія вибірки.
Причина, по якій дисперсія сукупності буде меншою, полягає в тому, що якщо ми знаємо кожне значення генеральної сукупності, ми знаємо точну дисперсію.
Однак, коли ми маємо лише вибірку сукупності, ми маємо більше невизначеності щодо точної дисперсії загальної сукупності, тому наша оцінка дисперсії має бути більшою.
У наступному прикладі показано, як використовувати ці функції на практиці.
Приклад: VAR.P проти VAR.S в Excel
Припустімо, що в Excel є такий набір даних:
На наступному знімку екрана показано, як обчислити дисперсію набору даних за допомогою трьох різних формул дисперсії:
Дисперсія вибірки виявляється 76,99 , а дисперсія сукупності виявляється 73,14 .
Як згадувалося раніше, дисперсія сукупності завжди буде меншою, ніж дисперсія вибірки.
Коли використовувати VAR.P проти VAR.S
У більшості випадків ми не можемо зібрати дані для всієї сукупності. Тому ми збираємо дані лише для вибірки населення.
Отже, ми майже завжди використовуємо VAR.S для обчислення дисперсії набору даних, оскільки наш набір даних зазвичай представляє вибірку.
Зауважте, що VAR і VAR.S повертають однакові значення, тому ми можемо використовувати будь-яку функцію для обчислення вибіркової дисперсії заданого набору даних.
Додаткові ресурси
STDEV.P проти STDEV.S в Excel: у чому різниця?
Як обчислити міжквартильний діапазон (IQR) в Excel
Як розрахувати середній діапазон в Excel