Как выполнить тест на нормальность в google sheets


Многие статистические тесты предполагают, что значения в наборе данных имеют нормальное распределение .

Один из самых простых способов проверить эту гипотезу — выполнить тест Жарка-Бера , который представляет собой критерий согласия, который определяет, демонстрируют ли выборочные данные асимметрию и эксцесс, соответствующие нормальному распределению.

В этом тесте используются следующие предположения:

  • H 0 : Данные распределяются нормально.
  • H A : Данные не распределяются нормально.

Статистика теста JB определяется как:

JB =(n/6) * ( S2 + ( C2 /4))

Золото:

  • n: количество наблюдений в выборке
  • S: асимметрия образца
  • C: лестный образец

При нулевой гипотезе нормальности JB ~ X 2 (2).

Если значение p , соответствующее тестовой статистике, ниже определенного уровня значимости (например, α = 0,05), то мы можем отвергнуть нулевую гипотезу и сделать вывод, что данные не распределяются нормально.

В этом руководстве представлен пошаговый пример выполнения теста Жарка-Бера для заданного набора данных в Google Sheets.

Шаг 1: Введите данные

Сначала давайте создадим фальшивый набор данных с 15 значениями:

Шаг 2. Рассчитайте статистику теста

Далее мы рассчитаем статистику теста JB.

В столбце E показаны использованные формулы:

Статистика теста оказывается 1,0175 .

Шаг 3: Рассчитайте значение P

При нулевой гипотезе нормальности статистика теста JB соответствует распределению хи-квадрат с двумя степенями свободы.

Итак, чтобы найти значение p для теста, мы будем использовать следующую формулу:

=CHISQ.DIST.RT(статистика теста JB, 2)

На следующем снимке экрана показано, как использовать эту формулу на практике:

тест на нормальность в Google Sheets

P-значение теста составляет 0,601244 .

Помните, что этот тест на нормальность Жарка-Бера использует следующие гипотезы:

  • H 0 : Данные распределяются нормально.
  • H A : Данные не распределяются нормально.

Поскольку это значение p не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас недостаточно доказательств, чтобы сказать, что набор данных не распределен нормально.

Другими словами, можно предположить, что данные нормально распределены.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в Google Таблицах:

Как выполнить t-тесты в Google Sheets
Как выполнить F-тесты в Google Sheets
Как рассчитать доверительные интервалы в Google Таблицах

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *