Как выполнить тест на нормальность в google sheets
Многие статистические тесты предполагают, что значения в наборе данных имеют нормальное распределение .
Один из самых простых способов проверить эту гипотезу — выполнить тест Жарка-Бера , который представляет собой критерий согласия, который определяет, демонстрируют ли выборочные данные асимметрию и эксцесс, соответствующие нормальному распределению.
В этом тесте используются следующие предположения:
- H 0 : Данные распределяются нормально.
- H A : Данные не распределяются нормально.
Статистика теста JB определяется как:
JB =(n/6) * ( S2 + ( C2 /4))
Золото:
- n: количество наблюдений в выборке
- S: асимметрия образца
- C: лестный образец
При нулевой гипотезе нормальности JB ~ X 2 (2).
Если значение p , соответствующее тестовой статистике, ниже определенного уровня значимости (например, α = 0,05), то мы можем отвергнуть нулевую гипотезу и сделать вывод, что данные не распределяются нормально.
В этом руководстве представлен пошаговый пример выполнения теста Жарка-Бера для заданного набора данных в Google Sheets.
Шаг 1: Введите данные
Сначала давайте создадим фальшивый набор данных с 15 значениями:
Шаг 2. Рассчитайте статистику теста
Далее мы рассчитаем статистику теста JB.
В столбце E показаны использованные формулы:
Статистика теста оказывается 1,0175 .
Шаг 3: Рассчитайте значение P
При нулевой гипотезе нормальности статистика теста JB соответствует распределению хи-квадрат с двумя степенями свободы.
Итак, чтобы найти значение p для теста, мы будем использовать следующую формулу:
=CHISQ.DIST.RT(статистика теста JB, 2)
На следующем снимке экрана показано, как использовать эту формулу на практике:
P-значение теста составляет 0,601244 .
Помните, что этот тест на нормальность Жарка-Бера использует следующие гипотезы:
- H 0 : Данные распределяются нормально.
- H A : Данные не распределяются нормально.
Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.
Это означает, что у нас недостаточно доказательств, чтобы сказать, что набор данных не распределен нормально.
Другими словами, можно предположить, что данные нормально распределены.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в Google Таблицах:
Как выполнить t-тесты в Google Sheets
Как выполнить F-тесты в Google Sheets
Как рассчитать доверительные интервалы в Google Таблицах