Jak wykonać test t dla nierównej wielkości próbek


Pytanie, które uczniowie często zadają, jeśli chodzi o statystyki, brzmi:

Czy można przeprowadzić test t, gdy liczebność prób w każdej grupie nie jest równa?

Krótka odpowiedź:

Tak, można wykonać test t, gdy liczebność próbek nie jest równa. Równe wielkości próbek nie są jednym z założeń przyjętych w teście t.

Prawdziwe problemy pojawiają się, gdy dwie próbki nie mają równych wariancji, co jest jednym z założeń przyjętych w teście t.

W takim przypadku zaleca się zamiast tego użycie testu t Welcha , który nie zakłada równych wariancji.

Poniższe przykłady pokazują, jak przeprowadzić testy T dla próbek o różnej wielkości, gdy wariancje są równe i gdy nie są.

Przykład 1: Nierówne wielkości próbek i równe wariancje

Załóżmy, że administrujemy dwoma programami, które mają pomóc uczniom osiągać lepsze wyniki na niektórych egzaminach.

Wyniki są następujące:

Program 1:

  • n (wielkość próbki): 500
  • x (średnia próbki): 80
  • s (przykładowe odchylenie standardowe): 5

Program 2:

  • n (wielkość próbki): 20
  • x (średnia próbki): 85
  • s (przykładowe odchylenie standardowe): 5

Poniższy kod pokazuje, jak utworzyć wykres pudełkowy w języku R, aby zwizualizować rozkład wyników egzaminów dla każdego programu:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=5)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

Średni wynik egzaminu w ramach Programu 2 wydaje się wyższy, ale różnice w wynikach egzaminów pomiędzy obydwoma programami są w przybliżeniu równe.

Poniższy kod pokazuje, jak przeprowadzić test t dla niezależnych próbek za pomocą testu t Welcha:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -3.3348, df = 518, p-value = 0.0009148
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.111504 -1.580245
sample estimates:
mean of x mean of y 
 80.11322 83.95910

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -3.3735, df = 20.589, p-value = 0.00293
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.219551 -1.472199
sample estimates:
mean of x mean of y 
 80.11322 83.95910 

Test t niezależnych próbek zwraca wartość p 0,0009 , a test t Welcha zwraca wartość p 0,0029 .

Ponieważ wartość p każdego testu jest mniejsza niż 0,05, odrzucilibyśmy hipotezę zerową w każdym teście i doszliśmy do wniosku, że istnieje statystycznie istotna różnica w średnich wynikach egzaminów pomiędzy obydwoma programami.

Mimo że rozmiary próbek są nierówne, test t dla niezależnych próbek i test t Welcha dają podobne wyniki, ponieważ obie próbki miały równe wariancje.

Przykład 2: Nierówne wielkości próbek i nierówne wariancje

Załóżmy, że administrujemy dwoma programami, które mają pomóc uczniom osiągać lepsze wyniki na niektórych egzaminach.

Wyniki są następujące:

Program 1:

  • n (wielkość próbki): 500
  • x (średnia próbki): 80
  • s (przykładowe odchylenie standardowe): 25

Program 2:

  • n (wielkość próbki): 20
  • x (średnia próbki): 85
  • s (przykładowe odchylenie standardowe): 5

Poniższy kod pokazuje, jak utworzyć wykres pudełkowy w języku R, aby zwizualizować rozkład wyników egzaminów dla każdego programu:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=25)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

Średni wynik egzaminu dla Programu 2 wydaje się wyższy, ale rozbieżność wyników egzaminu dla Programu 1 jest znacznie większa niż w przypadku Programu 2.

Poniższy kod pokazuje, jak przeprowadzić test t dla niezależnych próbek za pomocą testu t Welcha:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -0.5988, df = 518, p-value = 0.5496
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.52474 7.73875
sample estimates:
mean of x mean of y 
  80.5661 83.9591

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -2.1338, df = 74.934, p-value = 0.03613
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.560690 -0.225296
sample estimates:
mean of x mean of y 
  80.5661 83.9591 

Test t niezależnych próbek zwraca wartość p 0,5496 , a test t Welcha zwraca wartość p 0,0361 .

Test t niezależnych próbek nie jest w stanie wykryć różnicy w średnich wynikach egzaminu, ale test t Welcha jest w stanie wykryć różnicę istotną statystycznie.

Ponieważ obie próbki miały nierówne wariancje, jedynie test t Welcha był w stanie wykryć statystycznie istotną różnicę w średnich wynikach egzaminu, ponieważ test ten nie zakłada równych wariancji między próbami .

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat testów t:

Wprowadzenie do testu t dla jednej próby
Wprowadzenie do testu t dla dwóch prób
Wprowadzenie do testu t dla par próbek

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *