Как выполнить двусторонний дисперсионный анализ в excel
Двусторонний дисперсионный анализ («дисперсионный анализ») используется для определения того, существует ли статистически значимая разница между средними значениями трех или более независимых групп, которые были разделены по двум факторам.
В этом руководстве объясняется, как выполнить двусторонний дисперсионный анализ в Excel.
Пример: двусторонний дисперсионный анализ в Excel
Ботаник хочет знать, влияют ли на рост растений воздействие солнечного света и частота полива. Она сажает 40 семян и дает им расти в течение двух месяцев при различных условиях солнечного света и частоты полива. Через два месяца она записывает высоту каждого растения. Результаты показаны ниже:
В таблице выше мы видим, что в каждой комбинации условий выращивалось по пять растений. Например, пять растений выращивались при ежедневном поливе и без солнечного света, а их высота через два месяца составила 4,8 дюйма, 4,4 дюйма, 3,2 дюйма, 3,9 дюйма и 4,4 дюйма:
Мы можем использовать следующие шаги для выполнения двустороннего дисперсионного анализа этих данных:
Шаг 1. Выберите пакет инструментов анализа данных.
На вкладке «Данные» нажмите «Анализ данных» :
Если вы не видите эту опцию, вам следует сначала загрузить бесплатный пакет инструментов анализа данных .
2. Выбирайте Anova: два фактора с репликацией
Выберите вариант с надписью Anova: Two-Factor With Replication и нажмите «ОК» .
В этом контексте «репликация» означает наличие нескольких наблюдений в каждой группе. Например, многие растения выращивались без воздействия солнечных лучей и без ежедневного полива. Если бы вместо этого мы выращивали только одно растение в каждой комбинации условий, мы бы использовали «без репликации», но размер нашей выборки был бы намного меньше.
3. Заполните необходимые значения.
Далее заполните следующие значения:
- Диапазон ввода: выберите диапазон ячеек, в которых расположены наши данные, включая заголовки.
- Рядов на образец: введите «5», поскольку в каждом образце содержится 5 растений.
- Альфа: выберите уровень значимости для использования. Мы выберем 0,05.
- Выходной диапазон: выберите ячейку, в которой вы хотите, чтобы отображались выходные данные двустороннего дисперсионного анализа. Мы выберем ячейку $G$4.
Шаг 4: Интерпретируйте результат.
Как только мы нажмем «ОК» , появится результат двустороннего дисперсионного анализа:
В первых трех таблицах представлена сводная статистика по каждой группе. Например:
- Средняя высота растений, поливаемых ежедневно, но без солнечного света, составляла 4,14 дюйма.
- Средняя высота растений, поливаемых еженедельно и получающих мало солнечного света, составила 5,22 дюйма.
- Средняя высота всех растений, поливаемых ежедневно, составила 5,115 дюйма.
- Средняя высота всех растений, поливаемых каждую неделю, составляла 5,15 дюйма.
- Средняя высота всех растений при сильном воздействии солнца составила 5,55 дюйма.
И так далее.
В последней таблице показаны результаты двустороннего дисперсионного анализа. Мы можем наблюдать следующее:
- Значение p для взаимодействия между частотой полива и пребыванием на солнце составило 0,310898 . Это не является статистически значимым на уровне альфа 0,05.
- Значение p для частоты полива составило 0,975975 . Это не является статистически значимым на уровне альфа 0,05.
- Значение p для пребывания на солнце составило 3,9E-8 (0,000000039) . Это статистически значимо на уровне альфа 0,05.
Эти результаты показывают, что воздействие солнца является единственным фактором, статистически значимо влияющим на высоту растений. А поскольку эффекта взаимодействия нет, эффект воздействия солнца одинаков на каждом уровне частоты полива. Проще говоря, то, поливают ли растение ежедневно или еженедельно, не влияет на то, как солнце влияет на растение.