So führen sie den tukey-test in python durch
Eine einfaktorielle ANOVA wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen besteht.
Wenn der Gesamt -p-Wert der ANOVA-Tabelle unter einem bestimmten Signifikanzniveau liegt, verfügen wir über ausreichende Beweise dafür, dass sich mindestens einer der Gruppenmittelwerte von den anderen unterscheidet.
Dies sagt uns jedoch nicht, welche Gruppen sich voneinander unterscheiden. Dies zeigt uns einfach, dass nicht alle Gruppendurchschnitte gleich sind. Um genau zu wissen, welche Gruppen sich voneinander unterscheiden, müssen wir einenPost-hoc-Test durchführen.
Einer der am häufigsten verwendeten Post-hoc-Tests ist der Tukey-Test , der es uns ermöglicht, paarweise Vergleiche zwischen den Mittelwerten jeder Gruppe durchzuführen und gleichzeitig die Familienfehlerrate zu kontrollieren.
Dieses Tutorial bietet ein schrittweises Beispiel für die Durchführung des Tukey-Tests in Python.
Schritt 1: Laden Sie die erforderlichen Pakete und Funktionen
Zuerst laden wir die notwendigen Pakete und Funktionen in Python:
import pandas as pd
import numpy as np
from scipy. stats import f_oneway
from statsmodels. stats . multicomp import pairwise_tukeyhsd
Schritt 2: Passen Sie das ANOVA-Modell an
Der folgende Code zeigt, wie man einen gefälschten Datensatz mit drei Gruppen (A, B und C) erstellt und ein einfaktorielles ANOVA-Modell an die Daten anpasst, um zu bestimmen, ob die Mittelwerte jeder Gruppe gleich sind:
#enter data for three groups a = [85, 86, 88, 75, 78, 94, 98, 79, 71, 80] b = [91, 92, 93, 90, 97, 94, 82, 88, 95, 96] c = [79, 78, 88, 94, 92, 85, 83, 85, 82, 81] #perform one-way ANOVA f_oneway(a, b, c) F_onewayResult(statistic=5.167774552944481, pvalue=0.012582197136592609)
Wir können sehen, dass der Gesamt-p-Wert aus der ANOVA-Tabelle 0,01258 beträgt.
Da diese Zahl weniger als 0,05 beträgt, haben wir genügend Beweise dafür, dass die Durchschnittswerte in jeder Gruppe nicht gleich sind.
Wir können also den Tukey-Test durchführen, um genau zu bestimmen, welche Gruppenmittelwerte unterschiedlich sind.
Schritt 3: Führen Sie den Tukey-Test durch
Um den Tukey-Test in Python durchzuführen, können wir die Funktion pairwise_tukeyhsd() aus der statsmodels- Bibliothek verwenden:
#create DataFrame to hold data df = pd. DataFrame ({'score': [85, 86, 88, 75, 78, 94, 98, 79, 71, 80, 91, 92, 93, 90, 97, 94, 82, 88, 95, 96, 79, 78, 88, 94, 92, 85, 83, 85, 82, 81], 'group': np. repeat (['a', 'b', 'c'], repeats= 10 )}) # perform Tukey's test tukey = pairwise_tukeyhsd(endog=df['score'], groups=df['group'], alpha= 0.05 ) #display results print (tukey) Multiple Comparison of Means - Tukey HSD, FWER=0.05 ==================================================== === group1 group2 meandiff p-adj lower upper reject -------------------------------------------------- --- ab 8.4 0.0158 1.4272 15.3728 True ac 1.3 0.8864 -5.6728 8.2728 False bc -7.1 0.0453 -14.0728 -0.1272 True -------------------------------------------------- ---
So interpretieren Sie das Ergebnis:
- P-Wert für die Mittelwertdifferenz zwischen a und b: 0,0158
- P-Wert für die Mittelwertdifferenz zwischen a und c: 0,8864
- P-Wert für die Mittelwertdifferenz zwischen b und c: 0,0453
Daraus würden wir schließen, dass es einen statistisch signifikanten Unterschied zwischen den Mittelwerten der Gruppen a und b und den Gruppen b und c gibt, aber keinen statistisch signifikanten Unterschied zwischen den Mittelwerten der Gruppen a und c .
Zusätzliche Ressourcen
So führen Sie eine einfaktorielle ANOVA in Python durch
So führen Sie eine zweifaktorielle ANOVA in Python durch
So führen Sie eine ANOVA mit wiederholten Messungen in Python durch