Die vier in einem t-test formulierten hypothesen
Ein T-Test mit zwei Stichproben wird verwendet, um zu testen, ob die Mittelwerte zweier Grundgesamtheiten gleich sind oder nicht.
Diese Art von Test geht von den folgenden Annahmen über die Daten aus:
1. Unabhängigkeit: Die Beobachtungen einer Stichprobe sind unabhängig von den Beobachtungen der anderen Stichprobe.
2. Normalität: Beide Stichproben weisen eine annähernd normale Verteilung auf.
3. Homogenität der Varianzen: Die beiden Stichproben weisen annähernd die gleiche Varianz auf.
4. Zufallsstichprobe: Beide Stichproben wurden mittels Zufallsstichprobenmethode entnommen.
Wenn eine oder mehrere dieser Annahmen verletzt werden, können die Ergebnisse des T-Tests bei zwei Stichproben unzuverlässig oder sogar irreführend sein.
In diesem Tutorial erklären wir jede Annahme, wie man ermittelt, ob die Annahme erfüllt ist, und was zu tun ist, wenn sie verletzt wird.
Hypothese 1: Unabhängigkeit
Bei einem T-Test mit zwei Stichproben wird davon ausgegangen, dass die Beobachtungen einer Stichprobe unabhängig von den Beobachtungen der anderen Stichprobe sind.
Dies ist eine entscheidende Annahme, denn wenn in beiden Stichproben dieselben Personen vorkommen, ist es nicht zulässig, Rückschlüsse auf Unterschiede zwischen den Stichproben zu ziehen.
So überprüfen Sie diese Hypothese
Der einfachste Weg, diese Annahme zu testen, besteht darin, zu überprüfen, ob jede Beobachtung in jeder Stichprobe nur einmal vorkommt und dass die Beobachtungen in jeder Stichprobe durch Zufallsstichproben erfasst wurden.
Was tun, wenn diese Annahme nicht respektiert wird?
Wenn diese Annahme nicht erfüllt ist, sind die Ergebnisse des T-Tests bei zwei Stichproben völlig ungültig. In diesem Szenario ist es am besten, zwei neue Stichproben mithilfe einer Zufallsstichprobenmethode zu sammeln und sicherzustellen, dass nicht jede Person in einer Stichprobe zur anderen Stichprobe gehört.
Hypothese 2: Normalität
Bei einem T-Test mit zwei Stichproben wird davon ausgegangen, dass die beiden Stichproben annähernd normalverteilt sind.
Dies ist eine entscheidende Annahme, denn wenn die Stichproben nicht normalverteilt sind, ist es nicht zulässig, die p-Werte aus dem Test zu verwenden, um Rückschlüsse auf Unterschiede zwischen Stichproben zu ziehen.
So überprüfen Sie diese Hypothese
Wenn die Stichprobengrößen klein sind (n < 50), können wir einen Shapiro-Wilk-Test verwenden, um zu bestimmen, ob jede Stichprobengröße normalverteilt ist. Wenn der p-Wert des Tests unter einem bestimmten Signifikanzniveau liegt, sind die Daten wahrscheinlich nicht normalverteilt.
Wenn die Stichprobengrößen groß sind, ist es besser, ein QQ-Diagramm zu verwenden, um visuell zu überprüfen, ob die Daten normalverteilt sind.
Wenn die Datenpunkte in einem QQ-Diagramm ungefähr entlang einer geraden diagonalen Linie liegen, folgt der Datensatz wahrscheinlich einer Normalverteilung.
Was tun, wenn diese Annahme nicht respektiert wird?
Wenn diese Annahme verletzt wird, können wir einen Mann-Whitney-U-Test durchführen, der als nichtparametrisches Äquivalent des Zwei-Stichproben-t-Tests gilt und nicht davon ausgeht, dass die beiden Stichproben normalverteilt sind.
Hypothese 3: Homogenität der Unterschiede
Bei einem T-Test mit zwei Stichproben wird davon ausgegangen, dass die beiden Stichproben ungefähr gleiche Varianzen aufweisen.
So überprüfen Sie diese Hypothese
Um zu bestimmen, ob die Varianzen zwischen den beiden Stichproben gleich sind, verwenden wir folgende Faustregel: Wenn das Verhältnis der größten Varianz zur kleinsten Varianz kleiner als 4 ist, dann können wir davon ausgehen, dass die Varianzen annähernd gleich sind und verwenden beide Stichproben t -prüfen.
Angenommen, Stichprobe 1 weist eine Varianz von 24,5 und Stichprobe 2 eine Varianz von 15,2 auf. Das Verhältnis der größten Stichprobenvarianz zur kleinsten Stichprobenvarianz würde wie folgt berechnet:
Verhältnis: 24,5 / 15,2 = 1,61
Da dieses Verhältnis weniger als 4 beträgt, könnte man davon ausgehen, dass die Unterschiede zwischen den beiden Gruppen ungefähr gleich sind.
Was tun, wenn diese Annahme nicht respektiert wird?
Wenn diese Annahme verletzt wird, können wir den Welch-T-Test durchführen, der eine nichtparametrische Version des Zwei-Stichproben-T-Tests ist und nicht davon ausgeht, dass die beiden Stichproben gleiche Varianzen haben.
Annahme 4: Zufallsstichprobe
Bei einem T-Test mit zwei Stichproben wird davon ausgegangen, dass beide Stichproben mithilfe einer Zufallsstichprobenmethode ermittelt wurden.
So überprüfen Sie diese Hypothese
Es gibt keinen formalen statistischen Test, mit dem wir diese Hypothese testen können. Stattdessen müssen wir lediglich sicherstellen, dass beide Stichproben mithilfe einer Zufallsstichprobenmethode gewonnen wurden, sodass jedes Individuum in der interessierenden Grundgesamtheit die gleiche Wahrscheinlichkeit hat, in die eine oder andere Stichprobe aufgenommen zu werden.
Was tun, wenn diese Annahme nicht respektiert wird?
Wenn diese Annahme nicht erfüllt ist, ist es unwahrscheinlich, dass unsere beiden Stichproben repräsentativ für die interessierende Population sind. In diesem Fall können wir die Ergebnisse des T-Tests bei zwei Stichproben nicht zuverlässig auf die Gesamtpopulation übertragen.
In diesem Szenario ist es am besten, zwei neue Stichproben mithilfe einer Zufallsstichprobenmethode zu sammeln.