R で事後ペア比較を実行する方法
一元配置分散分析は、 3 つ以上の独立したグループの平均間に統計的に有意な差があるかどうかを判断するために使用されます。
一元配置分散分析では、次の帰無仮説と対立仮説が使用されます。
- H 0 : すべてのグループ平均が等しい。
- H A : すべてのグループの平均が等しいわけではありません。
ANOVA の全体的なp 値が特定の有意水準 (例: α = 0.05) を下回る場合、帰無仮説は棄却され、すべてのグループ平均は等しくないと結論付けられます。
どのグループの平均が異なるかを調べるために、事後的なペアごとの比較を実行できます。
次の例は、R で次の事後ペア比較を実行する方法を示しています。
- テューキー法
- シェッフェ法
- ボンフェローニ法
- ホルム法
例: R での一元配置分散分析
教師が、3 つの異なる学習方法が生徒間でテストの得点に差をもたらすかどうかを知りたいとします。これをテストするために、彼女は 10 人の生徒をランダムに割り当てて各学習手法を使用させ、試験結果を記録しました。
R で次のコードを使用して一元配置分散分析を実行し、3 つのグループ間の試験の平均点の差をテストできます。
#create data frame df <- data.frame(technique = rep(c(" tech1 ", " tech2 ", " tech3 "), each= 10 ), score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89, 81, 82, 83, 83, 83, 84, 87, 90, 92, 93, 77, 78, 79, 88, 89, 90, 91, 95, 95, 98)) #perform one-way ANOVA model <- aov(score ~ technique, data = df) #view output of ANOVA summary(model) Df Sum Sq Mean Sq F value Pr(>F) technical 2 211.5 105.73 3.415 0.0476 * Residuals 27 836.0 30.96 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
ANOVA の全体的な p 値 (0.0476) は α = 0.05 未満であるため、試験の平均スコアは各学習手法で同じであるという帰無仮説を棄却します。
事後的なペアごとの比較を実行して、どのグループが異なる平均値を持つかを判断できます。
テューキー法
各グループのサンプル サイズが等しい場合は、Tukey の事後法を使用するのが最適です。
組み込みのTukeyHSD()関数を使用して、R で Tukey ポストホック メソッドを実行できます。
#perform the Tukey post-hoc method TukeyHSD(model, conf. level = .95 ) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = score ~ technique, data = df) $technical diff lwr upr p adj tech2-tech1 4.2 -1.9700112 10.370011 0.2281369 tech3-tech1 6.4 0.2299888 12.570011 0.0409017 tech3-tech2 2.2 -3.9700112 8.370011 0.6547756
結果から、0.05 未満の唯一の p 値 (「 p adj 」) がテクニックとテクニック 3 の差であることがわかります。
したがって、テクニック 1 とテクニック 3 を使用した生徒の間では、試験の平均点に統計的に有意な差があるだけであると結論付けられます。
シェッフェ法
シェッフェ法は、最も保守的な事後ペア比較法であり、グループ平均を比較するときに最も広い信頼区間を生成します。
DescToolsパッケージのScheffeTest()関数を使用して、R で Scheffe ポストホック メソッドを実行できます。
library (DescTools)
#perform the Scheffe post-hoc method
ScheffeTest(model)
Posthoc multiple comparisons of means: Scheffe Test
95% family-wise confidence level
$technical
diff lwr.ci upr.ci pval
tech2-tech1 4.2 -2.24527202 10.645272 0.2582
tech3-tech1 6.4 -0.04527202 12.845272 0.0519 .
tech3-tech2 2.2 -4.24527202 8.645272 0.6803
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1'''156
結果から、0.05 より低い p 値はないことがわかり、グループ間で試験の平均得点に統計的に有意な差はないと結論付けることができます。
ボンフェローニ法
一連の計画されたペアごとの比較を実行する場合は、Bonferroni メソッドを使用するのが最適です。
R で次の構文を使用して、Bonferroni 事後メソッドを実行できます。
#perform the Bonferroni post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' bonferroni ')
Pairwise comparisons using t tests with pooled SD
data: df$score and df$technique
tech1 tech2
tech2 0.309 -
tech3 0.048 1.000
P value adjustment method: bonferroni
結果から、0.05 未満の唯一の p 値は、テクニックとテクニック 3 の差であることがわかります。
したがって、テクニック 1 とテクニック 3 を使用した生徒の間では、試験の平均点に統計的に有意な差があるだけであると結論付けられます。
ホルム法
Holm 法は、計画された一連のペアごとの比較を事前に実行する場合にも使用され、Bonferroni 法よりも検出力がさらに高くなる傾向があるため、多くの場合好まれます。
R で次の構文を使用して、Holm ポストホック メソッドを実行できます。
#perform the Holm post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' holm ')
Pairwise comparisons using t tests with pooled SD
data: df$score and df$technique
tech1 tech2
tech2 0.206 -
tech3 0.048 0.384
P value adjustment method: holm
結果から、0.05 未満の唯一の p 値は、テクニックとテクニック 3 の差であることがわかります。
したがって、繰り返しになりますが、テクニック 1 とテクニック 3 を使用した生徒の間では、試験の平均点に統計的に有意な差があるだけであると結論付けられます。
追加リソース
次のチュートリアルでは、ANOVA と事後テストに関する追加情報を提供します。
ANOVA での F 値と P 値の解釈方法
完全ガイド: ANOVA 結果を報告する方法
テューキー vs.ボンフェローニ vs.シェッフェ: どのテストを使用する必要がありますか?