So führen sie post-hoc-paarweise vergleiche in r durch
Eine einfaktorielle ANOVA wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen besteht.
Eine einfaktorielle ANOVA verwendet die folgenden Null- und Alternativhypothesen:
- H 0 : Alle Gruppenmittelwerte sind gleich.
- H A : Nicht alle Gruppendurchschnitte sind gleich.
Wenn der Gesamt -p-Wert der ANOVA unter einem bestimmten Signifikanzniveau liegt (z. B. α = 0,05), lehnen wir die Nullhypothese ab und kommen zu dem Schluss, dass nicht alle Gruppenmittelwerte gleich sind.
Um herauszufinden, welche Gruppenmittelwerte unterschiedlich sind, können wir dann post-hoc paarweise Vergleiche durchführen.
Das folgende Beispiel zeigt, wie die folgenden paarweisen Post-hoc-Vergleiche in R durchgeführt werden:
- Die Tukey-Methode
- Die Scheffe-Methode
- Die Bonferroni-Methode
- Die Holm-Methode
Beispiel: Einfaktorielle ANOVA in R
Angenommen, ein Lehrer möchte wissen, ob drei verschiedene Lerntechniken zu unterschiedlichen Testergebnissen bei den Schülern führen. Um dies zu testen, weist sie nach dem Zufallsprinzip 10 Studenten zu, jede Lerntechnik anzuwenden, und zeichnet ihre Prüfungsergebnisse auf.
Wir können den folgenden Code in R verwenden, um eine einfaktorielle ANOVA durchzuführen, um Unterschiede in den durchschnittlichen Prüfungsergebnissen zwischen den drei Gruppen zu testen:
#create data frame df <- data.frame(technique = rep(c(" tech1 ", " tech2 ", " tech3 "), each= 10 ), score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89, 81, 82, 83, 83, 83, 84, 87, 90, 92, 93, 77, 78, 79, 88, 89, 90, 91, 95, 95, 98)) #perform one-way ANOVA model <- aov(score ~ technique, data = df) #view output of ANOVA summary(model) Df Sum Sq Mean Sq F value Pr(>F) technical 2 211.5 105.73 3.415 0.0476 * Residuals 27 836.0 30.96 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Der Gesamt-p-Wert der ANOVA (0,0476) ist kleiner als α = 0,05, daher lehnen wir die Nullhypothese ab, dass die durchschnittliche Prüfungspunktzahl für jede Lerntechnik gleich ist.
Wir können nachträglich paarweise Vergleiche durchführen, um festzustellen, welche Gruppen unterschiedliche Mittelwerte haben.
Die Tukey-Methode
Es ist am besten, die Post-hoc-Methode von Tukey zu verwenden, wenn die Stichprobengröße jeder Gruppe gleich ist.
Wir können die integrierte Funktion TukeyHSD() verwenden, um die Tukey-Post-hoc-Methode in R auszuführen:
#perform the Tukey post-hoc method TukeyHSD(model, conf. level = .95 ) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = score ~ technique, data = df) $technical diff lwr upr p adj tech2-tech1 4.2 -1.9700112 10.370011 0.2281369 tech3-tech1 6.4 0.2299888 12.570011 0.0409017 tech3-tech2 2.2 -3.9700112 8.370011 0.6547756
Aus dem Ergebnis können wir ersehen, dass der einzige p-Wert („ p adj “) kleiner als 0,05 der Unterschied zwischen Technik und Technik 3 ist.
Daher kommen wir zu dem Schluss, dass es nur einen statistisch signifikanten Unterschied in den durchschnittlichen Prüfungsergebnissen zwischen Schülern gibt, die Technik 1 und Technik 3 verwendet haben.
Die Scheffe-Methode
Die Scheffe-Methode ist die konservativste Methode für den paarweisen Post-hoc-Vergleich und erzeugt beim Vergleich von Gruppenmitteln die breitesten Konfidenzintervalle.
Wir können die Funktion ScheffeTest() aus dem Paket DescTools verwenden, um die Post-hoc-Methode von Scheffe in R auszuführen:
library (DescTools)
#perform the Scheffe post-hoc method
ScheffeTest(model)
Posthoc multiple comparisons of means: Scheffe Test
95% family-wise confidence level
$technical
diff lwr.ci upr.ci pval
tech2-tech1 4.2 -2.24527202 10.645272 0.2582
tech3-tech1 6.4 -0.04527202 12.845272 0.0519 .
tech3-tech2 2.2 -4.24527202 8.645272 0.6803
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1'''156
Aus den Ergebnissen können wir ersehen, dass es keine p-Werte unter 0,05 gibt, sodass wir zu dem Schluss kommen, dass zwischen den Gruppen kein statistisch signifikanter Unterschied in den durchschnittlichen Prüfungsergebnissen besteht.
Die Bonferroni-Methode
Am besten verwenden Sie die Bonferroni-Methode, wenn Sie eine Reihe geplanter paarweiser Vergleiche durchführen möchten.
Wir können die folgende Syntax in R verwenden, um die Bonferroni-Post-Hoc-Methode auszuführen:
#perform the Bonferroni post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' bonferroni ')
Pairwise comparisons using t tests with pooled SD
data: df$score and df$technique
tech1 tech2
tech2 0.309 -
tech3 0.048 1.000
P value adjustment method: bonferroni
Aus dem Ergebnis können wir ersehen, dass der einzige p-Wert kleiner als 0,05 der Unterschied zwischen Technik und Technik 3 ist.
Daher kommen wir zu dem Schluss, dass es nur einen statistisch signifikanten Unterschied in den durchschnittlichen Prüfungsergebnissen zwischen Schülern gibt, die Technik 1 und Technik 3 verwendet haben.
Die Holm-Methode
Die Holm-Methode wird auch verwendet, wenn Sie vorab eine Reihe geplanter paarweiser Vergleiche durchführen möchten. Sie weist tendenziell eine noch höhere Aussagekraft als die Bonferroni-Methode auf und wird daher häufig bevorzugt.
Wir können die folgende Syntax in R verwenden, um die Holm-Post-hoc-Methode auszuführen:
#perform the Holm post-hoc method
pairwise. t . test (df$score, df$technique, p. adj = ' holm ')
Pairwise comparisons using t tests with pooled SD
data: df$score and df$technique
tech1 tech2
tech2 0.206 -
tech3 0.048 0.384
P value adjustment method: holm
Aus dem Ergebnis können wir ersehen, dass der einzige p-Wert kleiner als 0,05 der Unterschied zwischen Technik und Technik 3 ist.
Daher würden wir wiederum zu dem Schluss kommen, dass es nur einen statistisch signifikanten Unterschied in den durchschnittlichen Prüfungsergebnissen zwischen Schülern gibt, die Technik 1 und Technik 3 verwendet haben.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zu ANOVA und Post-hoc-Tests:
So interpretieren Sie den F-Wert und den P-Wert in der ANOVA
Der vollständige Leitfaden: So melden Sie ANOVA-Ergebnisse
Tukey vs. Bonferroni vs. Scheffe: Welchen Test sollten Sie verwenden?