Welchs t-test: wann man ihn verwendet + beispiele


Wenn wir die Mittelwerte zweier unabhängiger Gruppen vergleichen möchten, können wir zwischen zwei verschiedenen Tests wählen:

Student-T-Test: Bei diesem Test wird davon ausgegangen, dass die beiden Datengruppen aus Populationen stammen, die einerNormalverteilung folgen, und dass die beiden Populationen die gleiche Varianz aufweisen.

Welch-T-Test: Bei diesem Test wird davon ausgegangen, dass beide Datengruppen aus Populationen stammen, die einer Normalverteilung folgen. Es wird jedoch nicht davon ausgegangen, dass diese beiden Populationen die gleiche Varianz aufweisen .

Der Unterschied zwischen dem Student-T-Test und dem Welch-T-Test

Es gibt zwei Unterschiede in der Durchführung des Student-T-Tests und des Welch-T-Tests:

  • Die Teststatistik
  • Freiheitsgrade

Schüler-T-Test:

Teststatistik: ( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 )

Dabei sind x 1 und x 2 die Stichprobenmittelwerte, n 1 und n 2 die Stichprobengrößen für Stichprobe 1 bzw. Stichprobe 2 und wobei sp wie folgt berechnet wird:

s p = (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

wobei s 1 2 und s 2 2 die Stichprobenvarianzen sind.

Freiheitsgrade: n 1 + n 2 – 2

Welchs T-Test

Teststatistik: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Freiheitsgrade: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Die Formel zur Berechnung der Freiheitsgrade für den Welch-t-Test berücksichtigt die Differenz zwischen den beiden Standardabweichungen. Wenn die beiden Stichproben die gleichen Standardabweichungen aufweisen, sind die Freiheitsgrade des Welch-T-Tests genau die gleichen wie die Freiheitsgrade des Student-T-Tests.

Typischerweise sind die Standardabweichungen für die beiden Stichproben nicht gleich und daher sind die Freiheitsgrade des Welch-T-Tests tendenziell kleiner als die Freiheitsgrade des Student-T-Tests.

Es ist auch wichtig zu beachten, dass die Freiheitsgrade im t-Test von Welch im Allgemeinen keine ganze Zahl sind. Wenn Sie manuell testen, ist es am besten, auf die niedrigste ganze Zahl zu runden. Wenn Sie Statistiksoftware wie R verwenden, kann die Software den Dezimalwert der Freiheitsgrade liefern.

Wann sollten Sie den Welch-t-Test verwenden?

Einige Leute argumentieren, dass der Welch-T-Test die Standardwahl für den Vergleich der Mittelwerte zweier unabhängiger Gruppen sein sollte, da er eine bessere Leistung als der Student-T-Test erbringt, wenn die Stichprobengrößen und Varianzen zwischen den Gruppen ungleich sind, und er identische Ergebnisse liefert, wenn die Stichprobengrößen unterschiedlich sind sind anders. die Unterschiede sind gleich.

Wenn Sie in der Praxis die Mittelwerte zweier Gruppen vergleichen, ist es unwahrscheinlich, dass die Standardabweichungen jeder Gruppe gleich sind. Daher ist es eine gute Idee, immer den Welch-T-Test zu verwenden, damit Sie keine Annahmen über die Gleichheit der Varianzen treffen müssen.

Beispiele für die Verwendung des Welch-T-Tests

Als Nächstes führen wir den Welch-T-Test an den folgenden beiden Stichproben durch, um zu bestimmen, ob sich ihre Populationsmittelwerte bei einem Signifikanzniveau von 0,05 signifikant unterscheiden:

Probe 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

Probe 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

Wir veranschaulichen, wie der Test auf drei verschiedene Arten durchgeführt wird:

  • Durch die Hand
  • Verwenden Sie Microsoft Excel
  • Verwenden Sie die statistische Programmiersprache R

Welch-T-Test von Hand

Um den Welch-t-Test manuell durchzuführen, müssen wir zunächst die Stichprobenmittelwerte, Stichprobenvarianzen und Stichprobengrößen ermitteln:

x1 19.27
x2 23,69
S 1 14 – 20:42 Uhr
Art. 2 2 – 83.23
# 1 – 11
#
2 – 13

Dann können wir diese Zahlen eingeben, um die Teststatistik zu ermitteln:

Teststatistik: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Teststatistik: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538

Freiheitsgrade: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Freiheitsgrade: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Wir runden dieses Ergebnis auf die nächste ganze Zahl, 18 .

Schließlich finden wir den kritischen Wert t in der t-Verteilungstabelle, der einem zweiseitigen Test mit Alpha = 0,05 für 18 Freiheitsgrade entspricht:

Verteilungstabelle T

Der kritische Wert t beträgt 2,101 . Da der Absolutwert unserer Teststatistik (1,538) nicht größer als der kritische Wert t ist, können wir die Nullhypothese des Tests nicht ablehnen. Es gibt nicht genügend Beweise dafür, dass die Mittelwerte der beiden Populationen signifikant unterschiedlich sind.

Welch-T-Test mit Excel

Um den Welch-T-Test in Excel durchzuführen, müssen wir zunächst die kostenlose Analysis ToolPak-Software herunterladen. Wenn Sie es noch nicht in Excel heruntergeladen haben, habe ich eine kurze Anleitung zum Herunterladen geschrieben.

Nachdem Sie Analysis ToolPak heruntergeladen haben, können Sie die folgenden Schritte ausführen, um den Welch-T-Test für unsere beiden Proben durchzuführen:

1. Geben Sie die Daten ein. Geben Sie die Datenwerte für die beiden Proben in die Spalten A und B und die Überschriften „Probe 1“ und „Probe 2“ in die erste Zelle jeder Spalte ein.

2. Führen Sie den Welch-t-Test mit Analysis ToolPak durch. Gehen Sie im oberen Menüband zur Registerkarte „Daten“ . Klicken Sie anschließend unter der Gruppe „Analyse“ auf das Symbol „Analysis ToolPak“.

Klicken Sie im angezeigten Dialogfeld auf „T-Test: Zwei Stichproben unter der Annahme ungleicher Varianzen“ und dann auf „OK“.

Geben Sie abschließend die folgenden Werte ein und klicken Sie dann auf OK:

Das folgende Ergebnis sollte erscheinen:

Beachten Sie, dass die Ergebnisse dieses Tests den Ergebnissen entsprechen, die wir manuell erhalten haben:

  • Die Teststatistik ist -1,5379 .
  • Der zweiseitige kritische Wert beträgt 2,1009 .
  • Da der absolute Wert der Teststatistik nicht größer als der zweiseitige kritische Wert ist, unterscheiden sich die Mittelwerte der beiden Grundgesamtheiten statistisch nicht.
  • Darüber hinaus beträgt der zweiseitige p-Wert des Tests 0,14, was größer als 0,05 ist und bestätigt, dass die Mittelwerte der beiden Populationen statistisch nicht unterschiedlich sind.

Welchs t-Test mit R

Der folgende Code veranschaulicht, wie der Welch-t-Test für unsere beiden Stichproben mithilfe der statistischen Programmiersprache R durchgeführt wird:

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

Die Funktion t.test() zeigt die folgende relevante Ausgabe an:

  • t: die Teststatistik = -1,5379
  • df : Freiheitsgrade = 18,137
  • p-Wert: der p-Wert des zweiseitigen Tests = 0,1413
  • 95 %-Konfidenzintervall : das 95 %-Konfidenzintervall für den wahren Unterschied in den Populationsmittelwerten = (-10,45, 1,61)

Die Ergebnisse dieses Tests entsprechen denen, die manuell und mit Excel erhalten wurden: Der Mittelwertunterschied für diese beiden Populationen ist auf dem Niveau von Alpha = 0,05 statistisch nicht signifikant.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert