Was ist der unterschied zwischen einem t-test und einer anova?


In diesem Tutorial wird der Unterschied zwischen einem t-Test und einer ANOVA sowie die Verwendung der einzelnen Tests erläutert.

T-Test

Mithilfe eines T-Tests wird ermittelt, ob zwischen den Mittelwerten zweier Gruppen ein statistisch signifikanter Unterschied besteht. Es gibt zwei Arten von T-Tests:

1. T-Test unabhängiger Stichproben. Dies wird verwendet, wenn wir die Differenz zwischen den Mittelwerten zweier Gruppen vergleichen möchten und die Gruppen völlig unabhängig voneinander sind.

Forscher möchten beispielsweise wissen, ob Diät A oder Diät B Menschen dabei hilft, mehr Gewicht zu verlieren. 100 zufällig ausgewählte Personen werden der Diät A zugeordnet. Weitere 100 zufällig ausgewählte Personen werden der Diät B zugewiesen. Nach drei Monaten erfassen die Forscher den Gesamtgewichtsverlust jeder Person. Um festzustellen, ob der durchschnittliche Gewichtsverlust zwischen den beiden Gruppen signifikant unterschiedlich ist, können Forscher einen T-Test für unabhängige Stichproben durchführen.

2. T-Test für gepaarte Stichproben . Dies wird verwendet, wenn wir die Differenz zwischen den Mittelwerten zweier Gruppen vergleichen möchten und jede Beobachtung einer Gruppe mit einer Beobachtung der anderen Gruppe verknüpft werden kann.

Nehmen wir zum Beispiel an, 20 Schüler einer Klasse machen einen Test, studieren dann einen bestimmten Leitfaden und machen dann den Test erneut. Um die Differenz zwischen den ersten und zweiten Testergebnissen zu vergleichen, verwenden wir einen gepaarten T-Test, da für jeden Schüler sein erstes Testergebnis mit seinem zweiten Testergebnis verknüpft werden kann.

Damit ein t-Test gültige Ergebnisse liefert, müssen die folgenden Annahmen erfüllt sein:

  • Zufällig: Um Daten für beide Stichproben zu sammeln, sollte eine Zufallsstichprobe oder ein Zufallsexperiment verwendet werden.
  • Normal: Die Stichprobenverteilung ist normal oder annähernd normal.

Wenn diese Annahmen erfüllt sind, ist es möglich, einen T-Test zu verwenden, um die Differenz zwischen den Mittelwerten zweier Gruppen zu testen.

ANOVA

Mithilfe einer ANOVA (Varianzanalyse) wird ermittelt, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen besteht. Die in der Praxis am häufigsten verwendeten ANOVA-Tests sind die einfaktorielle ANOVA und die zweifaktorielle ANOVA:

Einfaktorielle ANOVA: Wird verwendet, um zu testen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen besteht, wenn die Gruppen anhand eines einzelnen Faktors aufgeteilt werden können.

Beispiel: Sie teilen eine Klasse mit 90 Schülern nach dem Zufallsprinzip in drei Gruppen zu je 30 Schülern auf. Jede Gruppe verwendet einen Monat lang eine andere Lerntechnik, um sich auf eine Prüfung vorzubereiten. Am Ende des Monats legen alle Studierenden die gleiche Prüfung ab. Sie möchten wissen, ob die Lerntechnik einen Einfluss auf die Prüfungsergebnisse hat. Sie führen also eine einfaktorielle ANOVA durch, um festzustellen, ob zwischen den Durchschnittswerten der drei Gruppen ein statistisch signifikanter Unterschied besteht.

Zweifaktorielle ANOVA: Wird verwendet, um zu testen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen besteht, wenn die Gruppen nach zwei Faktoren aufgeteilt werden können.

Beispiel: Sie möchten feststellen, ob das Trainingsniveau (kein Training, leichtes Training, intensives Training) und das Geschlecht (männlich, weiblich) einen Einfluss auf die Gewichtsabnahme haben. In diesem Fall sind die beiden Faktoren, die Sie untersuchen, Bewegung und Geschlecht, und Ihre Antwortvariable ist der Gewichtsverlust (gemessen in Pfund). Sie können eine Zwei-Wege-ANOVA durchführen, um festzustellen, ob Bewegung und Geschlecht einen Einfluss auf die Gewichtsabnahme haben und um festzustellen, ob eine Wechselwirkung zwischen Bewegung und Geschlecht auf die Gewichtsabnahme besteht.

Damit eine ANOVA gültige Ergebnisse liefert, müssen die folgenden Annahmen erfüllt sein:

  • Normalität – alle von uns untersuchten Populationen folgen einer Normalverteilung. Wenn wir beispielsweise die Prüfungsergebnisse von drei verschiedenen Gruppen von Studierenden vergleichen möchten, sollten die Prüfungsergebnisse der ersten Gruppe, der zweiten Gruppe und der dritten Gruppe alle normalverteilt sein.
  • Gleiche Varianz – die Populationsvarianzen in jeder Gruppe sind gleich oder annähernd gleich.
  • Unabhängigkeit – die Beobachtungen jeder Gruppe müssen unabhängig voneinander sein. Normalerweise wird dies durch einrandomisiertes Design erledigt.

Wenn diese Annahmen erfüllt sind, ist es möglich, eine ANOVA zu verwenden, um die Differenz zwischen den Mittelwerten von drei oder mehr Gruppen zu testen.

Verstehen Sie die Unterschiede zwischen den einzelnen Tests

Der Hauptunterschied zwischen einem T-Test und einer ANOVA besteht darin, wie beide Tests ihre Teststatistik berechnen, um festzustellen, ob ein statistisch signifikanter Unterschied zwischen den Gruppen besteht.

Ein t-Test bei unabhängigen Stichproben verwendet die folgende Teststatistik:

Teststatistik t = [ ( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

Dabei sind x 1 und x 2 die Stichprobenmittelwerte für die Gruppen 1 und 2, d die hypothetische Differenz zwischen den beiden Mittelwerten (oft ist sie Null), s 1 2 und s 2 2 die Stichprobenvarianzen für die Gruppen 1 und 2 und n 1 und n 2 sind die Stichprobengrößen für die Gruppen 1 bzw. 2.

Ein T-Test für gepaarte Stichproben verwendet die folgende Teststatistik:

Teststatistik t = d / (s d / √n)

Dabei ist d die mittlere Differenz zwischen den beiden Gruppen, s d die Standardabweichung der Differenzen und n die Stichprobengröße für jede Gruppe (beachten Sie, dass beide Gruppen die gleiche Stichprobengröße haben).

Eine ANOVA verwendet die folgende Teststatistik:

Teststatistik F = s 2 b / s 2 w

Dabei ist s 2 b die Varianz zwischen den Stichproben und s 2 w die Varianz innerhalb der Stichprobe.

Ein t-Test misst das Verhältnis der mittleren Differenz zwischen zwei Gruppen zur Gesamtstandardabweichung der Unterschiede. Wenn dieses Verhältnis hoch genug ist, ist dies ein ausreichender Beweis dafür, dass zwischen den beiden Gruppen ein signifikanter Unterschied besteht.

Eine ANOVA hingegen misst das Verhältnis der Varianz zwischen Gruppen im Vergleich zur Varianz innerhalb von Gruppen. Wie beim T-Test liefert dieses Verhältnis, wenn es hoch genug ist, genügend Beweise dafür, dass die drei Gruppen nicht den gleichen Mittelwert haben.

Ein weiterer wesentlicher Unterschied zwischen einem T-Test und einer ANOVA besteht darin, dass der T-Test uns sagen kann, ob zwei Gruppen den gleichen Mittelwert haben oder nicht. Eine ANOVA hingegen sagt uns, ob drei Gruppen alle den gleichen Mittelwert haben, aber sie sagt uns nicht explizit, welche Gruppen unterschiedliche Mittelwerte voneinander haben.

Um herauszufinden, welche Gruppen sich voneinander unterscheiden, wären Post-hoc-Tests erforderlich.

Verstehen Sie, wann Sie jeden Test verwenden sollten

Wenn wir in der Praxis die Mittelwerte zweier Gruppen vergleichen möchten , verwenden wir einen t-Test. Wenn wir die Mittelwerte von drei oder mehr Gruppen vergleichen möchten, verwenden wir eine ANOVA.

Der Grund dafür, dass wir nicht einfach mehrere T-Tests verwenden, um die Mittelwerte von drei oder mehr Gruppen zu vergleichen, liegt im Verständnis der Fehlerquote vom Typ I. Angenommen, wir möchten die Mittelwerte von drei Gruppen vergleichen : Gruppe A, Gruppe B und Gruppe C. Sie könnten versucht sein, die folgenden drei t-Tests durchzuführen:

  • Ein t-Test zum Vergleich der Mittelwertdifferenz zwischen Gruppe A und Gruppe B
  • Ein t-Test zum Vergleich der Mittelwertdifferenz zwischen Gruppe A und Gruppe C
  • Ein t-Test zum Vergleich der Mittelwertdifferenz zwischen Gruppe B und Gruppe C

Bei jedem t-Test besteht die Möglichkeit, dass wir einen Fehler vom Typ I machen, also die Wahrscheinlichkeit, dass wir die Nullhypothese ablehnen, wenn sie tatsächlich wahr ist. Diese Wahrscheinlichkeit beträgt im Allgemeinen 5 %. Das bedeutet, dass diese Fehlerrate steigt, wenn wir mehrere T-Tests durchführen. Zum Beispiel:

  • Die Wahrscheinlichkeit, dass wir mit einem einzelnen t-Test einen Fehler vom Typ I machen, beträgt 1 – 0,95 = 0,05 .
  • Die Wahrscheinlichkeit, dass wir mit zwei t-Tests einen Fehler vom Typ I machen, beträgt 1 – (0,95 2 ) = 0,0975 .
  • Die Wahrscheinlichkeit, dass wir mit zwei t-Tests einen Fehler vom Typ I machen, beträgt 1 – (0,95 3 ) = 0,1427 .

Diese Fehlerquote ist unakzeptabel hoch. Glücklicherweise werden diese Fehler durch eine ANOVA kontrolliert, so dass der Fehler vom Typ I bei nur 5 % bleibt. Dadurch können wir sicherer sein, dass ein statistisch signifikantes Testergebnis tatsächlich aussagekräftig ist und nicht nur ein Ergebnis, das wir durch die Durchführung zahlreicher Tests erhalten haben.

Wenn wir also verstehen wollen, ob es einen Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen gibt, müssen wir eine ANOVA verwenden, damit unsere Ergebnisse statistisch gültig und zuverlässig sind.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert