Jak wykonać test t dla dwóch próbek w r
Test t dla dwóch prób służy do sprawdzenia, czy średnie z dwóch populacji są równe, czy nie.
Aby wykonać test t z dwoma przykładami w języku R, możesz użyć następującej podstawowej składni:
t. test (group1, group2, var. equal = TRUE )
Uwaga : podając var.equal=TRUE , mówimy R, aby założył, że wariancje są równe między dwiema próbkami.
Jeśli nie chcesz przyjmować takiego założenia, po prostu odłóż ten argument na bok, a R zamiast tego wykona test t Welcha , który nie zakłada, że wariancje są równe pomiędzy próbkami.
Poniższy przykład pokazuje, jak w praktyce przeprowadzić test t dla dwóch próbek w R.
Przykład: Test T dla dwóch próbek w R
Załóżmy, że chcemy wiedzieć, czy dwa różne gatunki roślin mają tę samą średnią wysokość.
Aby to przetestować, zbieramy prostą losową próbkę 12 roślin z każdego gatunku.
Poniższy kod pokazuje, jak przeprowadzić test t dla dwóch próbek w R, aby określić, czy średni wzrost obu gatunków jest równy:
#create vectors to hold plant heights from each sample group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19) #perform two sample t-tests t. test (group1, group2, var. equal = TRUE ) Two Sample t-test data: group1 and group2 t = -2.5505, df = 22, p-value = 0.01823 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.5904820 -0.5761847 sample estimates: mean of x mean of y 11.66667 14.75000
Oto jak interpretować wyniki testu:
dane: nazwy wektorów zawierających przykładowe dane.
t: statystyka testu t. W tym przypadku jest to -2,5505 .
df : Stopnie swobody obliczane jako n 1 + n 2 – 2 = 12 + 12 – 2 = 22 .
Wartość p: Wartość p odpowiadająca statystyce testowej wynoszącej -2,5505 i df = 22. Wartość p wynosi 0,01823 . Możemy potwierdzić tę wartość za pomocą kalkulatora T Score do P Value .
95% przedział ufności: 95% przedział ufności dla prawdziwej różnicy średnich między obiema grupami. Okazuje się, że jest to [-5,59, -,576] .
szacunki próbek: średnia próbki z każdej grupy. W tym przypadku średnia próby dla Grupy 1 wyniosła 11,667 , a średnia próby dla Grupy 2 wyniosła 14,75 .
Hipotezy zerowe i alternatywne dla tego konkretnego testu t dla dwóch prób są następujące:
H 0 : µ 1 = µ 2 (średnie z obu populacji są równe)
H A : µ 1 ≠µ 2 (średnie z obu populacji nie są równe)
Wartość p naszego testu (0,01823) jest mniejsza niż 0,05, odrzucamy hipotezę zerową.
Oznacza to, że mamy wystarczające dowody, aby stwierdzić, że średnia wysokość roślin obu gatunków nie jest równa.
Uwagi techniczne
Funkcja t.test() w R używa następującej składni:
t. test (x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)
Złoto:
- x, y: nazwy dwóch wektorów zawierających dane.
- alternatywa: Hipoteza alternatywna. Dostępne opcje to „dwustronny”, „mniejszy” lub „większy”.
- mu: Wartość przyjęta jako prawdziwa różnica średnich.
- sparowany: czy zastosować test t dla par.
- var.equal: czy różnice między dwiema grupami są równe.
- conf.level: Poziom ufności używany w teście.
Podczas wykonywania własnego testu t możesz swobodnie modyfikować dowolny z tych argumentów, w zależności od konkretnego testu, który chcesz wykonać.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak wykonać test T dla jednej próby w R
Jak wykonać test T Welcha w R
Jak wykonać test t dla sparowanych próbek w R