Понимание нулевой гипотезы для моделей anova


Однофакторный дисперсионный анализ используется для определения наличия статистически значимой разницы между средними значениями трех или более независимых групп.

Односторонний дисперсионный анализ использует следующие нулевые и альтернативные гипотезы:

  • H 0 : μ 1 = μ 2 = μ 3 = … = μ k (все групповые средние равны)
  • H A : По крайней мере одно среднее значение группы отличается   отдых

Чтобы решить, следует ли нам отвергнуть нулевую гипотезу или нет, нам нужно обратиться к значению p в результате таблицы ANOVA.

Если значение p ниже определенного уровня значимости (например, 0,05), то мы можем отвергнуть нулевую гипотезу и сделать вывод, что не все групповые средние значения равны.

Двусторонний дисперсионный анализ используется для определения того, существует ли статистически значимая разница между средними значениями трех или более независимых групп, которым были присвоены две переменные (иногда называемые «факторами»).

Двусторонний дисперсионный анализ проверяет три нулевые гипотезы одновременно:

  • Все групповые средние значения равны на каждом уровне первой переменной.
  • Все средние значения группы равны на каждом уровне второй переменной.
  • Между двумя переменными нет эффекта взаимодействия.

Чтобы решить, следует ли нам отвергать каждую нулевую гипотезу, нам нужно обратиться к значениям p в результате двусторонней таблицы ANOVA.

Следующие примеры показывают, как решить, следует ли отклонять нулевую гипотезу в однофакторном и двуфакторном дисперсионном анализе.

Пример 1: Односторонний дисперсионный анализ

Предположим, мы хотим знать, приводят ли три разные программы подготовки к экзамену к разным средним баллам на данном экзамене. Чтобы проверить это, мы набираем 30 студентов для участия в исследовании и делим их на три группы.

Студентам в каждой группе случайным образом назначаются использовать одну из трех программ подготовки к экзамену в течение следующих трех недель для подготовки к экзамену. В конце трех недель все студенты сдают один и тот же экзамен.

Результаты экзамена для каждой группы показаны ниже:

Пример односторонних данных ANOVA

Когда мы вводим эти значения в односторонний калькулятор ANOVA , мы получаем на выходе следующую таблицу ANOVA:

Интерпретация выходной таблицы ANOVA

Обратите внимание, что значение p составляет 0,11385 .

Для этого конкретного примера мы бы использовали следующие нулевую и альтернативную гипотезы:

  • H 0 : μ 1 = μ 2 = μ 3 (средний балл экзамена для каждой группы одинаков)
  • H A : По крайней мере одно среднее значение группы отличается   отдых

Поскольку значение p таблицы ANOVA не менее 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что существует статистически значимая разница между средними баллами экзаменов трех групп.

Пример 2: Двусторонний дисперсионный анализ

Предположим, ботаник хочет знать, влияют ли на рост растений воздействие солнечного света и частота полива.

Она сажает 40 семян и дает им расти в течение двух месяцев при различных условиях солнечного света и частоты полива. Через два месяца она записывает высоту каждого растения. Результаты показаны ниже:

Таблица двустороннего дисперсионного анализа в Excel

В таблице выше мы видим, что в каждой комбинации условий выращивалось по пять растений.

Например, пять растений выращивались при ежедневном поливе и без солнечного света, а их высота через два месяца составила 4,8 дюйма, 4,4 дюйма, 3,2 дюйма, 3,9 дюйма и 4,4 дюйма:

Данные двустороннего дисперсионного анализа в Excel

Она выполняет двусторонний дисперсионный анализ в Excel и получает следующий результат:

Мы можем видеть следующие значения p в результате двусторонней таблицы ANOVA:

  • Значение p для частоты полива составляет 0,975975 . Это не является статистически значимым при уровне значимости 0,05.
  • Значение p для воздействия солнца составляет 3,9E-8 (0,000000039) . Это статистически значимо на уровне значимости 0,05.
  • Значение p для взаимодействия между частотой полива и пребыванием на солнце составляет 0,310898 . Это не является статистически значимым при уровне значимости 0,05.

Эти результаты показывают, что воздействие солнца является единственным фактором, статистически значимо влияющим на высоту растений.

А поскольку эффекта взаимодействия нет, эффект воздействия солнца одинаков на каждом уровне частоты полива.

Проще говоря, то, поливают ли растение ежедневно или еженедельно, не влияет на то, как солнце влияет на растение.

Дополнительные ресурсы

В следующих руководствах представлена дополнительная информация о моделях ANOVA:

Как интерпретировать значение F и значение P в ANOVA
Как посчитать сумму квадратов в ANOVA
Что означает высокое значение F в ANOVA?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *