Сбалансированный или несбалансированный дизайн: в чем разница?
В статистике модели ANOVA («дисперсионный анализ») используются для определения того, равны ли средние значения различных уровней лечения.
ANOVA имеет сбалансированный дизайн , если размеры выборки одинаковы для всех комбинаций лечения.
И наоборот, дисперсионный анализ имеет несбалансированный дизайн , если размеры выборки не одинаковы для всех комбинаций лечения.
Например, предположим, что мы хотим выполнить однофакторный дисперсионный анализ , чтобы определить, вызывают ли три разных удобрения одинаковый средний рост растений.
На следующем графике показан пример сбалансированного и несбалансированного плана для этого однофакторного дисперсионного анализа:
В сбалансированной схеме в каждой обработке используется одинаковое количество растений. В несбалансированном плане размеры выборки неравны.
Или предположим, что мы хотим выполнить двусторонний дисперсионный анализ , чтобы определить, вызывают ли разные комбинации удобрений и солнечного света одинаковый средний рост растений.
На следующем графике показан пример сбалансированного и несбалансированного плана для этого двустороннего дисперсионного анализа:
Связанный: Односторонний против. Двусторонний дисперсионный анализ: когда использовать каждый
Почему сбалансированный дизайн предпочтителен?
Сбалансированные конструкции имеют следующие преимущества перед несбалансированными:
1. Эффективность дисперсионного анализа максимальна, когда размеры выборки одинаковы для всех комбинаций лечения. Когда мощность самая высокая, у нас больше шансов обнаружить различия в средних значениях между комбинациями лечения, когда средние значения на самом деле различны.
2. Общая статистика F дисперсионного анализа менее чувствительна к нарушениям предположения о равенстве дисперсий .
Как возникают несбалансированные конструкции?
Несмотря на то, что исследователи пытаются создать сбалансированный план для ANOVA, существует несколько причин, по которым может возникнуть несбалансированный план, в том числе:
- Участники могут принять решение выйти из исследования на полпути.
- Растения могут просто погибнуть во время исследования
- Завод-производитель может закрыться и не иметь возможности поставлять определенные компоненты, необходимые для исследования.
Есть много причин, по которым опыт может внезапно стать несбалансированным.
Как бороться с несбалансированным дизайном
Как упоминалось ранее, сбалансированные конструкции предпочтительнее, поскольку они обеспечивают более высокую статистическую мощность и более надежную статистику испытаний.
Однако если вам необходимо провести эксперимент с использованием несбалансированного плана, у вас есть три варианта:
1. В любом случае проведите дисперсионный анализ.
Если размеры выборок в комбинациях методов лечения не равны, но предположение о равных дисперсиях выполняется, вы все равно можете провести дисперсионный анализ.
Хорошо известно, что дисперсионный анализ весьма устойчив к неравным размерам выборок, если дисперсии между каждой комбинацией методов лечения всегда равны.
2. Вменить недостающие значения.
Если между комбинациями лечения имеются лишь незначительные различия в размерах выборки, вы можете приписать недостающие значения, используя среднее или медиану уровней лечения.
Однако этот подход следует использовать с осторожностью и его следует использовать только в том случае, если размеры выборки изначально почти равны.
3. Выполните непараметрический тест.
Если размеры выборки не равны и предположение о равенстве дисперсий не выполняется, вместо этого вы можете выполнить непараметрический эквивалент дисперсионного анализа, например критерий Крускала-Уоллиса .
Этот тип теста гораздо более устойчив к неравным размерам выборки и неравным отклонениям между комбинациями лечения.