バランスの取れたデザインとアンバランスなデザイン: 違いは何ですか?
統計では、ANOVA (「分散分析」) モデルを使用して、さまざまな治療レベルの平均が等しいかどうかを判断します。
サンプルサイズがすべての治療の組み合わせで等しい場合、ANOVA はバランスのとれた設計になります。
逆に、サンプルサイズがすべての治療の組み合わせで等しくない場合、ANOVA の設計は不均衡になります。
たとえば、一元配置分散分析を実行して、3 つの異なる肥料が同じ平均的な植物の成長を引き起こすかどうかを判断したいとします。
次のグラフは、この一元配置分散分析のバランス型計画とアンバランス型計画の例を示しています。
バランスのとれた設計では、各処理に同じ数の植物が含まれます。アンバランス計画では、サンプル サイズは不等です。
または、二元配置分散分析を実行して、肥料と太陽光の異なる組み合わせが同じ平均的な植物の成長を引き起こすかどうかを判断したいとします。
次のグラフは、この二元配置分散分析のバランス型およびアンバランス型計画の例を示しています。
関連: 一方通行 vs.二元配置分散分析: それぞれをいつ使用するか
なぜバランスの取れたデザインが好まれるのでしょうか?
バランスのとれた設計には、アンバランスな設計に比べて次の利点があります。
1. ANOVA の検出力は、サンプル サイズがすべての治療の組み合わせで等しい場合に最も高くなります。検出力が最高の場合、実際には平均値が異なる場合でも、治療の組み合わせ間の平均値の差を検出できる可能性が最も高くなります。
2. ANOVA の全体的な F 統計量は、分散の等価性の仮定の違反に対する感度が低くなります。
アンバランスなデザインはどのようにして起こるのでしょうか?
研究者が ANOVA のバランスのとれた計画を確立しようとしても、不均衡な計画が発生する可能性がある理由はいくつかあります。
- 個人は研究を途中で中止することを決定できます
- 研究中に植物が枯れてしまう可能性もある
- 製造工場が閉鎖され、研究に必要な特定のコンポーネントを提供できない場合があります。
エクスペリエンスが突然アンバランスになる理由はたくさんあります。
アンバランスなデザインに対処する方法
前述したように、バランスのとれた設計は、より高い統計検出力とより信頼性の高いテスト統計を提供するため、推奨されます。
ただし、アンバランスな計画を使用して実験を実行する必要がある場合は、次の 3 つの選択肢があります。
1. とにかく ANOVA を実行します。
治療の組み合わせのサンプルサイズが等しくなくても、分散が等しいという仮定が満たされている場合でも、ANOVA を実行できます。
処理の各組み合わせ間の分散が常に等しい場合、ANOVA はサンプル サイズが等しくない場合でも非常に堅牢であることがよく知られています。
2. 欠損値を代入します。
治療の組み合わせ間でサンプルサイズにわずかな違いしかない場合は、治療レベルの平均または中央値を使用して欠損値を代入できます。
ただし、このアプローチは慎重に使用する必要があり、サンプル サイズが最初からほぼ等しい場合にのみ使用する必要があります。
3. ノンパラメトリック検定を実行します。
サンプル サイズが等しくなく、分散の等価性の仮定が満たされない場合は、代わりに、 クラスカル-ウォリス検定などの ANOVA と同等のノンパラメトリックな検定を実行できます。
このタイプの検定は、サンプル サイズが等しくない場合や、治療の組み合わせ間の分散が等しくない場合に、より堅牢です。