T-test bei zwei stichproben: definition, formel und beispiel
Ein T-Test mit zwei Stichproben wird verwendet, um zu bestimmen, ob die Mittelwerte zweier Grundgesamtheiten gleich sind oder nicht.
In diesem Tutorial wird Folgendes erklärt:
- Die Motivation für die Durchführung eines T-Tests bei zwei Stichproben.
- Die Formel zur Durchführung eines T-Tests bei zwei Stichproben.
- Die Annahmen, die erfüllt sein müssen, um einen T-Test bei zwei Stichproben durchzuführen.
- Ein Beispiel für die Durchführung eines T-Tests bei zwei Stichproben.
T-Test bei zwei Stichproben: Motivation
Angenommen, wir möchten wissen, ob das Durchschnittsgewicht zweier verschiedener Schildkrötenarten gleich ist oder nicht. Da es in jeder Population Tausende von Schildkröten gibt, wäre es zu zeitaufwändig und teuer, jede Schildkröte einzeln zu wiegen.
Stattdessen könnten wir eine einfache Zufallsstichprobe von 15 Schildkröten aus jeder Population ziehen und das Durchschnittsgewicht jeder Stichprobe verwenden, um zu bestimmen, ob das Durchschnittsgewicht zwischen den beiden Populationen gleich ist:
Es ist jedoch praktisch garantiert, dass das Durchschnittsgewicht zwischen den beiden Proben zumindest geringfügig unterschiedlich sein wird. Die Frage ist, ob dieser Unterschied statistisch signifikant ist . Glücklicherweise können wir diese Frage mit einem T-Test bei zwei Stichproben beantworten.
T-Test bei zwei Stichproben: Formel
Ein T-Test bei zwei Stichproben verwendet immer die folgende Nullhypothese:
- H 0 : μ 1 = μ 2 (die beiden Populationsmittelwerte sind gleich)
Die Alternativhypothese kann bilateral, links oder rechts sein:
- H 1 (zweiseitig): μ 1 ≠ μ 2 (die Mittelwerte der beiden Populationen sind nicht gleich)
- H 1 (links): μ 1 < μ 2 (der Mittelwert von Population 1 ist niedriger als der Mittelwert von Population 2)
- H 1 (rechts): μ 1 > μ 2 (der Mittelwert von Population 1 ist größer als der Mittelwert von Population 2)
Wir verwenden die folgende Formel, um die T-Test-Statistik zu berechnen:
Teststatistik: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
wobei x 1 und x 2 die Stichprobenmittelwerte sind, n 1 und n 2 die Stichprobengrößen sind und wobei sp wie folgt berechnet wird:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
wobei s 1 2 und s 2 2 die Stichprobenvarianzen sind.
Wenn der p-Wert, der der t-Test-Statistik mit (n 1 + n 2 -1) Freiheitsgraden entspricht, kleiner ist als das von Ihnen gewählte Signifikanzniveau (übliche Optionen sind 0,10, 0,05 und 0, 01), dann sind Sie kann die Nullhypothese ablehnen. .
T-Test bei zwei Stichproben: Hypothesen
Damit die Ergebnisse eines T-Tests bei zwei Stichproben gültig sind, müssen die folgenden Annahmen erfüllt sein:
- Die Beobachtungen einer Stichprobe müssen unabhängig von den Beobachtungen der anderen Stichprobe sein.
- Die Daten sollten annähernd normalverteilt sein.
- Die beiden Stichproben sollten ungefähr die gleiche Varianz aufweisen. Wenn diese Annahme nicht erfüllt ist, sollten Sie stattdessen den Welch-T-Test durchführen.
- Die Daten beider Proben wurden mithilfe einer Zufallsstichprobenmethode ermittelt.
T-Test bei zwei Stichproben : Beispiel
Angenommen, wir möchten wissen, ob das Durchschnittsgewicht zweier verschiedener Schildkrötenarten gleich ist oder nicht. Um dies zu testen, führen wir einen t-Test bei zwei Stichproben auf dem Signifikanzniveau α = 0,05 mit den folgenden Schritten durch:
Schritt 1: Sammeln Sie Beispieldaten.
Angenommen, wir sammeln eine Zufallsstichprobe von Schildkröten aus jeder Population mit den folgenden Informationen:
Probe 1:
- Stichprobengröße n 1 = 40
- Durchschnittliches Probengewicht x 1 = 300
- Stichprobenstandardabweichung s 1 = 18,5
Probe 2:
- Stichprobengröße n 2 = 38
- Durchschnittliches Probengewicht x 2 = 305
- Stichprobenstandardabweichung s 2 = 16,7
Schritt 2: Annahmen definieren.
Wir werden den Zwei-Stichproben-t-Test mit den folgenden Annahmen durchführen:
- H 0 : μ 1 = μ 2 (die beiden Populationsmittelwerte sind gleich)
- H 1 : μ 1 ≠ μ 2 (die beiden Populationsmittelwerte sind nicht gleich)
Schritt 3: Berechnen Sie die t -Test-Statistik.
Zuerst berechnen wir die gepoolte Standardabweichung sp :
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2) = √ ( 40-1)18,5 2 + (38-1) 16,7 2 / (40+38-2) = 17,647
Als nächstes berechnen wir die t -Test-Statistik:
t = ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 ) = (300-305) / 17,647(√ 1/40 + 1/38 ) = -1,2508
Schritt 4: Berechnen Sie den p-Wert der t- Test-Statistik.
Gemäß dem T-Score-zu-P-Wert-Rechner beträgt der mit t = -1,2508 und den Freiheitsgraden = n 1 + n 2 -2 = 40+38-2 = 76 verbundene p-Wert 0,21484 .
Schritt 5: Ziehen Sie eine Schlussfolgerung.
Da dieser p-Wert nicht niedriger als unser Signifikanzniveau α = 0,05 ist, können wir die Nullhypothese nicht ablehnen. Wir haben keine ausreichenden Beweise dafür, dass das Durchschnittsgewicht der Schildkröten zwischen diesen beiden Populationen unterschiedlich ist.
Hinweis: Sie können diesen gesamten T-Test bei zwei Stichproben auch einfach mit dem T-Test-Rechner bei zwei Stichproben durchführen.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie mit verschiedenen Statistikprogrammen einen T-Test bei zwei Stichproben durchführen:
So führen Sie einen T-Test bei zwei Stichproben in Excel durch
So führen Sie einen T-Test bei zwei Stichproben in SPSS durch
So führen Sie einen T-Test bei zwei Stichproben in Stata durch
So führen Sie einen T-Test bei zwei Stichproben in R durch
So führen Sie einen T-Test mit zwei Stichproben in Python durch
So führen Sie einen t-Test bei zwei Stichproben auf einem TI-84-Rechner durch