So führen sie den tukey-test in python durch


Eine einfaktorielle ANOVA wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen besteht.

Wenn der Gesamt -p-Wert der ANOVA-Tabelle unter einem bestimmten Signifikanzniveau liegt, verfügen wir über ausreichende Beweise dafür, dass sich mindestens einer der Gruppenmittelwerte von den anderen unterscheidet.

Dies sagt uns jedoch nicht, welche Gruppen sich voneinander unterscheiden. Dies zeigt uns einfach, dass nicht alle Gruppendurchschnitte gleich sind. Um genau zu wissen, welche Gruppen sich voneinander unterscheiden, müssen wir einenPost-hoc-Test durchführen.

Einer der am häufigsten verwendeten Post-hoc-Tests ist der Tukey-Test , der es uns ermöglicht, paarweise Vergleiche zwischen den Mittelwerten jeder Gruppe durchzuführen und gleichzeitig die Familienfehlerrate zu kontrollieren.

Dieses Tutorial bietet ein schrittweises Beispiel für die Durchführung des Tukey-Tests in Python.

Schritt 1: Laden Sie die erforderlichen Pakete und Funktionen

Zuerst laden wir die notwendigen Pakete und Funktionen in Python:

 import pandas as pd
import numpy as np
from scipy. stats import f_oneway
from statsmodels. stats . multicomp import pairwise_tukeyhsd

Schritt 2: Passen Sie das ANOVA-Modell an

Der folgende Code zeigt, wie man einen gefälschten Datensatz mit drei Gruppen (A, B und C) erstellt und ein einfaktorielles ANOVA-Modell an die Daten anpasst, um zu bestimmen, ob die Mittelwerte jeder Gruppe gleich sind:

 #enter data for three groups
a = [85, 86, 88, 75, 78, 94, 98, 79, 71, 80]
b = [91, 92, 93, 90, 97, 94, 82, 88, 95, 96]
c = [79, 78, 88, 94, 92, 85, 83, 85, 82, 81]

#perform one-way ANOVA
f_oneway(a, b, c)

F_onewayResult(statistic=5.167774552944481, pvalue=0.012582197136592609)

Wir können sehen, dass der Gesamt-p-Wert aus der ANOVA-Tabelle 0,01258 beträgt.

Da diese Zahl weniger als 0,05 beträgt, haben wir genügend Beweise dafür, dass die Durchschnittswerte in jeder Gruppe nicht gleich sind.

Wir können also den Tukey-Test durchführen, um genau zu bestimmen, welche Gruppenmittelwerte unterschiedlich sind.

Schritt 3: Führen Sie den Tukey-Test durch

Um den Tukey-Test in Python durchzuführen, können wir die Funktion pairwise_tukeyhsd() aus der statsmodels- Bibliothek verwenden:

 #create DataFrame to hold data
df = pd. DataFrame ({'score': [85, 86, 88, 75, 78, 94, 98, 79, 71, 80,
                             91, 92, 93, 90, 97, 94, 82, 88, 95, 96,
                             79, 78, 88, 94, 92, 85, 83, 85, 82, 81],
                   'group': np. repeat (['a', 'b', 'c'], repeats= 10 )}) 

# perform Tukey's test
tukey = pairwise_tukeyhsd(endog=df['score'],
                          groups=df['group'],
                          alpha= 0.05 )

#display results
print (tukey)

 Multiple Comparison of Means - Tukey HSD, FWER=0.05 
==================================================== ===
group1 group2 meandiff p-adj lower upper reject
-------------------------------------------------- ---
     ab 8.4 0.0158 1.4272 15.3728 True
     ac 1.3 0.8864 -5.6728 8.2728 False
     bc -7.1 0.0453 -14.0728 -0.1272 True
-------------------------------------------------- ---

So interpretieren Sie das Ergebnis:

  • P-Wert für die Mittelwertdifferenz zwischen a und b: 0,0158
  • P-Wert für die Mittelwertdifferenz zwischen a und c: 0,8864
  • P-Wert für die Mittelwertdifferenz zwischen b und c: 0,0453

Daraus würden wir schließen, dass es einen statistisch signifikanten Unterschied zwischen den Mittelwerten der Gruppen a und b und den Gruppen b und c gibt, aber keinen statistisch signifikanten Unterschied zwischen den Mittelwerten der Gruppen a und c .

Zusätzliche Ressourcen

So führen Sie eine einfaktorielle ANOVA in Python durch
So führen Sie eine zweifaktorielle ANOVA in Python durch
So führen Sie eine ANOVA mit wiederholten Messungen in Python durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert