Сбалансированный или несбалансированный дизайн: в чем разница?


В статистике модели ANOVA («дисперсионный анализ») используются для определения того, равны ли средние значения различных уровней лечения.

ANOVA имеет сбалансированный дизайн , если размеры выборки одинаковы для всех комбинаций лечения.

И наоборот, дисперсионный анализ имеет несбалансированный дизайн , если размеры выборки не одинаковы для всех комбинаций лечения.

Например, предположим, что мы хотим выполнить однофакторный дисперсионный анализ , чтобы определить, вызывают ли три разных удобрения одинаковый средний рост растений.

На следующем графике показан пример сбалансированного и несбалансированного плана для этого однофакторного дисперсионного анализа:

Односторонний дисперсионный анализ, сбалансированный или несбалансированный дизайн

В сбалансированной схеме в каждой обработке используется одинаковое количество растений. В несбалансированном плане размеры выборки неравны.

Или предположим, что мы хотим выполнить двусторонний дисперсионный анализ , чтобы определить, вызывают ли разные комбинации удобрений и солнечного света одинаковый средний рост растений.

На следующем графике показан пример сбалансированного и несбалансированного плана для этого двустороннего дисперсионного анализа:

Пример несбалансированного двухфакторного анализа ANOVA

Связанный: Односторонний против. Двусторонний дисперсионный анализ: когда использовать каждый

Почему сбалансированный дизайн предпочтителен?

Сбалансированные конструкции имеют следующие преимущества перед несбалансированными:

1. Эффективность дисперсионного анализа максимальна, когда размеры выборки одинаковы для всех комбинаций лечения. Когда мощность самая высокая, у нас больше шансов обнаружить различия в средних значениях между комбинациями лечения, когда средние значения на самом деле различны.

2. Общая статистика F дисперсионного анализа менее чувствительна к нарушениям предположения о равенстве дисперсий .

Как возникают несбалансированные конструкции?

Несмотря на то, что исследователи пытаются создать сбалансированный план для ANOVA, существует несколько причин, по которым может возникнуть несбалансированный план, в том числе:

  • Участники могут принять решение выйти из исследования на полпути.
  • Растения могут просто погибнуть во время исследования
  • Завод-производитель может закрыться и не иметь возможности поставлять определенные компоненты, необходимые для исследования.

Есть много причин, по которым опыт может внезапно стать несбалансированным.

Как бороться с несбалансированным дизайном

Как упоминалось ранее, сбалансированные конструкции предпочтительнее, поскольку они обеспечивают более высокую статистическую мощность и более надежную статистику испытаний.

Однако если вам необходимо провести эксперимент с использованием несбалансированного плана, у вас есть три варианта:

1. В любом случае проведите дисперсионный анализ.

Если размеры выборок в комбинациях методов лечения не равны, но предположение о равных дисперсиях выполняется, вы все равно можете провести дисперсионный анализ.

Хорошо известно, что дисперсионный анализ весьма устойчив к неравным размерам выборок, если дисперсии между каждой комбинацией методов лечения всегда равны.

2. Вменить недостающие значения.

Если между комбинациями лечения имеются лишь незначительные различия в размерах выборки, вы можете приписать недостающие значения, используя среднее или медиану уровней лечения.

Однако этот подход следует использовать с осторожностью и его следует использовать только в том случае, если размеры выборки изначально почти равны.

3. Выполните непараметрический тест.

Если размеры выборки не равны и предположение о равенстве дисперсий не выполняется, вместо этого вы можете выполнить непараметрический эквивалент дисперсионного анализа, например критерий Крускала-Уоллиса .

Этот тип теста гораздо более устойчив к неравным размерам выборки и неравным отклонениям между комбинациями лечения.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *