Збалансований чи незбалансований дизайн: у чому різниця?
У статистиці моделі ANOVA («дисперсійний аналіз») використовуються для визначення того, чи однакові середні значення різних рівнів лікування.
ANOVA має збалансований дизайн , якщо розміри вибірки однакові для всіх комбінацій лікування.
І навпаки, ANOVA має незбалансований дизайн , якщо розміри вибірки не однакові для всіх комбінацій лікування.
Наприклад, скажімо, ми хочемо виконати односторонній дисперсійний аналіз , щоб визначити, чи призводять три різні добрива до однакового середнього росту рослин.
На наступному графіку показано приклад збалансованого та незбалансованого дизайну для цього одностороннього ANOVA:

У збалансованому дизайні в кожній обробці є однакова кількість рослин. У незбалансованому дизайні розміри вибірки неоднакові.
Або припустімо, що ми хочемо виконати двосторонній дисперсійний аналіз , щоб визначити, чи різні комбінації добрив і сонячного світла викликають однаковий середній ріст рослин.
На наступному графіку показано приклад збалансованого та незбалансованого дизайну для цього двостороннього дисперсійного аналізу:

Пов’язане: Односторонній vs. Двосторонній дисперсійний аналіз: коли використовувати кожен
Чому перевага віддається збалансованому дизайну?
Збалансовані конструкції мають такі переваги перед незбалансованими:
1. Ефективність ANOVA є найвищою, коли розміри вибірки однакові для всіх комбінацій лікування. Коли потужність найвища, ми маємо найкращі шанси виявити відмінності в середніх значеннях між комбінаціями лікування, коли середні значення насправді різні.
2. Загальна F-статистика ANOVA менш чутлива до порушень припущення про рівність дисперсії .
Як виникають незбалансовані конструкції?
Незважаючи на те, що дослідники намагаються створити збалансований дизайн для дисперсійного аналізу, є кілька причин, чому може статися незбалансований дизайн, зокрема:
- Особи можуть вирішити вийти з дослідження на півдорозі
- Під час дослідження рослини можуть просто загинути
- Завод-виробник може закрити свої двері і не мати змоги доставити певні компоненти, необхідні для дослідження.
Є багато причин, чому досвід може раптово стати незбалансованим.
Як боротися з незбалансованим дизайном
Як згадувалося раніше, перевагу надають збалансованим дизайнам, оскільки вони забезпечують вищу статистичну потужність і надійнішу статистику тестів.
Однак, якщо вам потрібно провести експеримент із використанням незбалансованого дизайну, у вас є три варіанти:
1. Все одно виконайте ANOVA.
Якщо розміри вибірки в комбінаціях лікування не однакові, але виконується припущення щодо рівних дисперсій, ви все одно можете провести дисперсійний аналіз.
Добре відомо, що дисперсійний аналіз є досить стійким до нерівних розмірів вибірки, якщо дисперсії між кожною комбінацією методів лікування завжди рівні.
2. Введіть відсутні значення.
Якщо є лише незначні відмінності в розмірах вибірки між комбінаціями лікування, ви можете приписати відсутні значення, використовуючи середнє значення або медіану рівнів лікування.
Однак цей підхід слід використовувати з обережністю та лише тоді, коли розміри вибірки майже рівні.
3. Виконайте непараметричний тест.
Якщо розміри вибірки не однакові та припущення про рівність дисперсій не виконується, замість цього можна виконати непараметричний еквівалент дисперсійного аналізу, наприклад тест Краскела-Уолліса .
Цей тип тесту набагато стійкіший до неоднакових розмірів вибірки та неоднакових відхилень між комбінаціями лікування.