Der vollständige leitfaden: hypothesentests in r
Ein Hypothesentest ist ein formaler statistischer Test, den wir verwenden, um eine statistische Hypothese abzulehnen oder nicht abzulehnen.
In diesem Tutorial wird erläutert, wie Sie die folgenden Hypothesentests in R durchführen:
- Ein Beispiel-T-Test
- T-Test bei zwei Stichproben
- T-Test für gepaarte Stichproben
Wir können die Funktion t.test() in R verwenden, um jeden Testtyp durchzuführen:
#one sample t-test t. test (x, y = NULL, alternative = c(" two.sided ", " less ", " greater "), mu = 0, paired = FALSE, var.equal = FALSE , conf.level = 0.95, …)
Gold:
- x, y: die beiden Datenproben.
- Alternative: Die Alternativhypothese des Tests.
- mu: Der wahre Wert des Durchschnitts.
- gepaart: ob ein gepaarter t-Test durchgeführt werden soll oder nicht.
- var.equal: ob davon ausgegangen werden soll, dass die Varianzen zwischen den Stichproben gleich sind .
- conf.level: Das zu verwendende Konfidenzniveau .
Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.
Beispiel 1: T-Test bei einer Stichprobe in R
Ein T-Test bei einer Stichprobe wird verwendet, um zu testen, ob der Mittelwert einer Grundgesamtheit einem bestimmten Wert entspricht oder nicht.
Nehmen wir zum Beispiel an, wir möchten wissen, ob das Durchschnittsgewicht einer bestimmten Schildkrötenart 310 Pfund beträgt oder nicht. Wir machen uns auf den Weg und sammeln eine einfache Zufallsstichprobe von Schildkröten mit den folgenden Gewichten:
Gewicht : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
Der folgende Code zeigt, wie dieses T-Test-Beispiel in R durchgeführt wird:
#define vector of turtle weights turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) #perform one sample t-test t. test (x=turtle_weights,mu=310) One Sample t-test data: turtle_weights t = -1.5848, df = 12, p-value = 0.139 alternative hypothesis: true mean is not equal to 310 95 percent confidence interval: 303.4236 311.0379 sample estimates: mean of x 307.2308
Aus dem Ergebnis können wir sehen:
- T-Test-Statistik: -1,5848
- Freiheitsgrade: 12
- p-Wert: 0,139
- 95 %-Konfidenzintervall für den wahren Mittelwert: [303,4236, 311,0379]
- Durchschnittsgewicht der Schildkröten: 307.230
Da der p-Wert des Tests (0,139) nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen.
Das bedeutet, dass wir nicht genügend Beweise dafür haben, dass das Durchschnittsgewicht dieser Schildkrötenart etwas anderes als 310 Pfund beträgt.
Beispiel 2: T-Test bei zwei Stichproben in R
Ein T-Test mit zwei Stichproben wird verwendet, um zu testen, ob die Mittelwerte zweier Grundgesamtheiten gleich sind oder nicht.
Angenommen, wir möchten wissen, ob das Durchschnittsgewicht zweier verschiedener Schildkrötenarten gleich ist oder nicht. Um dies zu testen, sammeln wir eine einfache Zufallsstichprobe von Schildkröten jeder Art mit den folgenden Gewichten:
Probe 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
Probe 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305
Der folgende Code zeigt, wie diese beiden T-Test-Beispiele in R durchgeführt werden:
#define vector of turtle weights for each sample sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305) #perform two sample t-tests t. test (x = sample1, y = sample2) Welch Two Sample t-test data: sample1 and sample2 t = -2.1009, df = 19.112, p-value = 0.04914 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -14.73862953 -0.03060124 sample estimates: mean of x mean of y 307.2308 314.6154
Aus dem Ergebnis können wir sehen:
- T-Test-Statistik: -2,1009
- Freiheitsgrade: 19.112
- p-Wert: 0,04914
- 95 %-Konfidenzintervall für echte Mittelwertdifferenz: [-14,74, -0,03]
- Durchschnittsgewicht der Probe 1: 307,2308
- Durchschnittsgewicht der Probe 2: 314,6154
Da der p-Wert des Tests (0,04914) kleiner als 0,05 ist, lehnen wir die Nullhypothese ab.
Das bedeutet, dass wir genügend Beweise dafür haben, dass das Durchschnittsgewicht der beiden Arten nicht gleich ist.
Beispiel 3: T-Test bei gepaarten Stichproben in R
Ein t-Test für gepaarte Stichproben wird verwendet, um die Mittelwerte zweier Stichproben zu vergleichen, wenn jede Beobachtung in einer Stichprobe mit einer Beobachtung in der anderen Stichprobe verknüpft werden kann.
Nehmen wir zum Beispiel an, wir möchten wissen, ob ein bestimmtes Trainingsprogramm in der Lage ist, den maximalen vertikalen Sprung (in Zoll) von Basketballspielern zu steigern.
Um dies zu testen, können wir eine einfache Zufallsstichprobe von 12 College-Basketballspielern rekrutieren und jeden ihrer maximalen vertikalen Sprünge messen. Dann können wir jeden Spieler einen Monat lang das Trainingsprogramm anwenden lassen und dann am Ende des Monats erneut seinen maximalen vertikalen Sprung messen.
Die folgenden Daten zeigen die maximale Sprunghöhe (in Zoll) vor und nach der Verwendung des Trainingsprogramms für jeden Spieler:
Vorderseite : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21
Nachher : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20
Der folgende Code zeigt, wie dieser T-Test für gepaarte Stichproben in R durchgeführt wird:
#define before and after max jump heights before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21) after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20) #perform paired samples t-test t. test (x = before, y = after, paired = TRUE ) Paired t-test data: before and after t = -2.5289, df = 11, p-value = 0.02803 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.3379151 -0.1620849 sample estimates: mean of the differences -1.25
Aus dem Ergebnis können wir sehen:
- T-Test-Statistik: -2,5289
- Freiheitsgrade: 11
- p-Wert: 0,02803
- 95 %-Konfidenzintervall für echte Mittelwertdifferenz: [-2,34, -0,16]
- durchschnittlicher Unterschied zwischen vorher und nachher: -1,25
Da der p-Wert des Tests (0,02803) kleiner als 0,05 ist, lehnen wir die Nullhypothese ab.
Das bedeutet, dass wir genügend Beweise dafür haben, dass die durchschnittliche Sprunghöhe vor und nach der Anwendung des Trainingsprogramms nicht gleich ist.
Zusätzliche Ressourcen
Verwenden Sie die folgenden Online-Rechner, um verschiedene T-Tests automatisch durchzuführen:
Ein Beispiel für einen T-Test-Rechner
T-Test-Rechner für zwei Stichproben
T-Test-Rechner für gepaarte Stichproben