Vollständiger leitfaden: so interpretieren sie anova-ergebnisse in r

Von Dr. Benjamin Anderson Juli 25, 2023 Führung Keine Kommentare

Eine einfaktorielle ANOVA wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen besteht.

Dieses Tutorial bietet eine vollständige Anleitung zur Interpretation der Ergebnisse einer einfaktoriellen ANOVA in R.

Schritt 1: Erstellen Sie die Daten

Angenommen, wir möchten feststellen, ob drei verschiedene Trainingsprogramme bei Einzelpersonen zu unterschiedlichen durchschnittlichen Gewichtsverlusten führen.

Um dies zu testen, rekrutieren wir 90 Personen für die Teilnahme an einem Experiment, bei dem wir 30 Personen nach dem Zufallsprinzip dazu auffordern, einen Monat lang entweder Programm A, Programm B oder Programm C zu befolgen.

Der folgende Code erstellt den Datenrahmen, mit dem wir arbeiten werden:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data frame
head(data)

program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458

Schritt 2: Führen Sie die ANOVA durch

Als nächstes verwenden wir den Befehl aov(), um eine einfaktorielle ANOVA durchzuführen:

 #fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)

Schritt 3: Interpretieren Sie die ANOVA-Ergebnisse

Als Nächstes verwenden wir den Befehl summary() , um die Ergebnisse der einfaktoriellen ANOVA anzuzeigen:

 #view summary of one-way ANOVA model
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

So interpretieren Sie die einzelnen Ergebniswerte:

Programm Df: Die Freiheitsgrade des Variablenprogramms . Dies wird als #Gruppen -1 berechnet. In diesem Fall gab es 3 verschiedene Trainingsprogramme, daher ist dieser Wert: 3-1 = 2 .

Df-Residuen: Die Freiheitsgrade für die Residuen. Dies wird als #Gesamtbeobachtungen – #Gruppen berechnet. In diesem Fall gab es 90 Beobachtungen und 3 Gruppen, daher beträgt dieser Wert: 90 -3 = 87 .

Programmsummenquadrat: Die Summe der Quadrate, die der Variable program zugeordnet sind. Dieser Wert beträgt 98,93 .

Summe der quadrierten Residuen: Summe der mit Residuen oder „Fehlern“ verbundenen Quadrate. Dieser Wert beträgt 139,57 .

Mittleres Quadrat. Programm: Die durchschnittliche Summe der mit dem Programm verbundenen Quadrate. Dies wird als quadrierte Summe berechnet. Programm / Programm Df. In diesem Fall wird dies wie folgt berechnet: 98,93 / 2 = 49,46 .

Mittleres Quadrat. Residuen: mittlere Summe der mit den Residuen verbundenen Quadrate. Dies wird als quadrierte Summe berechnet. Rückstände / Rückstände Df. In diesem Fall errechnet sich dieser wie folgt: 139,57 / 87 = 1,60 .

F-Wert: Die Gesamt-F-Statistik des ANOVA-Modells. Dies wird als mittleres Quadrat berechnet. Programm / mittleres Quadrat. Rückstände. In diesem Fall wird es wie folgt berechnet: 49,46 / 1,60 = 30,83 .

Pr(>F): Der p-Wert, der der F-Statistik mit Zähler df = 2 und Nenner df = 87 zugeordnet ist. In diesem Fall beträgt der p-Wert 7,552e-11 , was eine extrem kleine Zahl ist.

Der wichtigste Wert in der Ergebnismenge ist der p-Wert, denn er sagt uns, ob es einen signifikanten Unterschied in den Mittelwerten zwischen den drei Gruppen gibt.

Denken Sie daran, dass eine einfaktorielle ANOVA die folgenden Null- und Alternativhypothesen verwendet:

H ₀ (Nullhypothese): Alle Gruppenmittelwerte sind gleich.
H _A (Alternativhypothese): Mindestens ein Gruppendurchschnitt unterscheidet sich von den anderen.

Da der p-Wert in unserer ANOVA-Tabelle (.7552e-11) kleiner als 0,05 ist, haben wir genügend Beweise, um die Nullhypothese abzulehnen.

Das bedeutet, dass wir genügend Beweise dafür haben, dass der durchschnittliche Gewichtsverlust der einzelnen Personen bei den drei Trainingsprogrammen nicht gleich ist.

Schritt 4: Post-hoc-Tests durchführen (falls erforderlich)

Wenn der p-Wert in der ANOVA-Ausgabe kleiner als 0,05 ist, lehnen wir die Nullhypothese ab. Dies zeigt uns, dass der Durchschnittswert zwischen den einzelnen Gruppen nicht gleich ist. Dies sagt uns jedoch nicht, welche Gruppen sich voneinander unterscheiden.

Um das herauszufinden, müssen wir einen Post-hoc-Test durchführen. In R können wir dazu die Funktion TukeyHSD() verwenden:

 #perform Tukey post-hoc test
TukeyHSD(model)

$program
         diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199

So interpretieren Sie die Ergebnisse:

Der angepasste p-Wert für die mittlere Differenz zwischen den Gruppen A und B beträgt 0,0100545 .
Der angepasste p-Wert für die mittlere Differenz zwischen den Gruppen A und C beträgt 0,0000000 .
Der angepasste p-Wert für die mittlere Differenz zwischen den Gruppen B und C beträgt 0,0000199 .

Da jeder der angepassten p-Werte unter 0,05 liegt, können wir daraus schließen, dass zwischen den einzelnen Gruppen ein signifikanter Unterschied im durchschnittlichen Gewichtsverlust besteht.

Zusätzliche Ressourcen

Einführung in die einfaktorielle ANOVA
So überprüfen Sie ANOVA-Annahmen
So führen Sie manuell eine einfaktorielle ANOVA durch
Rechner für einfaktorielle ANOVA

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen