Var.p vs var.s в excel: в чем разница?
Для расчета дисперсии в Excel можно использовать три различные функции:
1. VAR.P: эта функция рассчитывает дисперсию генеральной совокупности. Используйте эту функцию, когда диапазон значений представляет всю совокупность.
Эта функция использует следующую формулу:
Дисперсия генеральной совокупности = Σ(x i – µ) 2 / N
Золото:
- Σ: греческий символ, означающий «сумма».
- x i : i-е значение набора данных
- μ: средний показатель по численности населения
- N: Общее количество наблюдений
2. VAR.S: эта функция вычисляет выборочную дисперсию. Используйте эту функцию, когда диапазон значений представляет собой выборку значений, а не всю совокупность.
Эта функция использует следующую формулу:
Выборочная дисперсия = Σ(x i – x ) 2 / (n-1)
Золото:
- Σ: греческий символ, означающий «сумма».
- x i : i-е значение набора данных
- x : Образец означает
- N: Общее количество наблюдений
3. VAR: эта функция также рассчитывает выборочную дисперсию. Она вернет точно то же значение, что и функция VAR.S.
Техническое примечание:
Поскольку формула генеральной дисперсии делится на N вместо n-1 , генеральная дисперсия всегда будет меньше выборочной дисперсии.
Причина, по которой дисперсия совокупности будет меньше, заключается в том, что если мы знаем каждое значение совокупности, то мы знаем точную дисперсию.
Однако, когда у нас есть только выборка генеральной совокупности, у нас больше неопределенности относительно точной дисперсии генеральной совокупности, поэтому наша оценка дисперсии должна быть больше.
В следующем примере показано, как использовать эти функции на практике.
Пример: VAR.P и VAR.S в Excel
Предположим, у нас есть следующий набор данных в Excel:
На следующем снимке экрана показано, как рассчитать дисперсию набора данных с использованием трех различных формул дисперсии:
Выборочная дисперсия оказывается равной 76,99 , а генеральная дисперсия — 73,14 .
Как упоминалось ранее, генеральная дисперсия всегда будет меньше выборочной дисперсии.
Когда использовать VAR.P против VAR.S
В большинстве случаев мы не можем собрать данные по всему населению. Поэтому мы собираем данные только для выборки населения.
Итак, мы почти всегда используем VAR.S для расчета дисперсии набора данных, поскольку наш набор данных обычно представляет собой выборку.
Обратите внимание, что VAR и VAR.S возвращают одни и те же значения, поэтому мы можем использовать любую функцию для расчета выборочной дисперсии данного набора данных.
Дополнительные ресурсы
STDEV.P и STDEV.S в Excel: в чем разница?
Как рассчитать межквартильный размах (IQR) в Excel
Как рассчитать средний диапазон в Excel