Test t welcha: kiedy go stosować + przykłady


Gdy chcemy porównać średnie dwóch niezależnych grup, możemy wybrać pomiędzy zastosowaniem dwóch różnych testów:

Test t-Studenta: W tym teście zakłada się, że dwie grupy danych są próbkowane z populacji o rozkładzie normalnym i że obie populacje mają tę samą wariancję.

Test t Welcha: w tym teście zakłada się, że obie grupy danych są próbkowane z populacji o rozkładzie normalnym, ale nie zakłada, że te dwie populacje mają tę samą wariancję .

Różnica między testem t-Studenta a testem t-Studenta

Istnieją dwie różnice w sposobie wykonywania testu t-Studenta i testu t-Studenta:

  • Statystyka testowa
  • Stopnie swobody

Test t-Studenta:

Statystyka testowa: ( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 )

gdzie x 1 i x 2 to średnie próbki, n 1 i n 2 to wielkości próbek, odpowiednio dla próbki 1 i próbki 2, oraz gdzie sp oblicza się w następujący sposób:

s p = (n 1 -1) s 1 2 + (n 2 -1) s 2 2 / (n 1 + n 2 -2)

gdzie s 1 2 i s 2 2 są wariancjami próbki.

Stopnie swobody: n 1 + n 2 – 2

Test T Welcha

Statystyka testowa: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Stopnie swobody: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Wzór na obliczenie stopni swobody testu t Welcha uwzględnia różnicę między dwoma odchyleniami standardowymi. Jeżeli obie próbki mają takie same odchylenia standardowe, wówczas stopnie swobody testu t-Studenta będą dokładnie takie same, jak stopnie swobody testu t-Studenta.

Zazwyczaj odchylenia standardowe dla dwóch próbek nie są takie same i dlatego stopnie swobody testu t-Studenta są zwykle mniejsze niż stopnie swobody testu t-Studenta.

Należy również zauważyć, że stopnie swobody w teście t Welcha na ogół nie są liczbami całkowitymi. Jeśli testujesz ręcznie, najlepiej zaokrąglić do najniższej liczby całkowitej. Jeśli użyjesz oprogramowania statystycznego, takiego jak R , oprogramowanie będzie w stanie podać dziesiętną wartość stopni swobody.

Kiedy należy zastosować test t Welcha?

Niektórzy twierdzą, że test t Welcha powinien być domyślnym wyborem do porównywania średnich dwóch niezależnych grup, ponieważ sprawdza się lepiej niż test t-Studenta, gdy liczebność próbek i wariancje są nierówne pomiędzy grupami, a także daje identyczne wyniki, gdy wielkość próbek są różne. różnice są równe.

W praktyce, gdy porównuje się średnie dwóch grup, jest mało prawdopodobne, aby odchylenia standardowe w każdej grupie były takie same. Dlatego dobrym pomysłem jest zawsze używanie testu t Welcha, dzięki czemu nie trzeba przyjmować założeń dotyczących równości wariancji.

Przykłady wykorzystania testu t Welcha

Następnie przeprowadzimy test t Welcha na następujących dwóch próbach, aby określić, czy ich średnie z populacji różnią się istotnie na poziomie istotności 0,05:

Próbka 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

Próbka 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

Zilustrujemy, jak przeprowadzić test na trzy różne sposoby:

  • Za rękę
  • Skorzystaj z Microsoft Excela
  • Użyj statystycznego języka programowania R

Ręcznie wykonany test Welcha

Aby ręcznie wykonać test t Welcha, musimy najpierw znaleźć średnie próbki, wariancje próbek i wielkość próbek:

x1 19.27
x2 23,69
s 1 2 – 20:42
sztuka 2 2 – 83.23
# 1 – 11
#
2 – 13

Następnie możemy wprowadzić te liczby, aby znaleźć statystykę testową:

Statystyka testowa: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Statystyka testowa: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538

Stopnie swobody: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Stopnie swobody: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Zaokrąglamy ten wynik do najbliższej liczby całkowitej, 18 .

Na koniec znajdziemy wartość krytyczną t w tabeli rozkładu t, która odpowiada dwustronnemu testowi z alfa = 0,05 dla 18 stopni swobody:

Tablica rozdzielcza T

Wartość krytyczna t wynosi 2,101 . Ponieważ wartość bezwzględna naszej statystyki testowej (1,538) nie jest większa niż wartość krytyczna t, nie udaje nam się odrzucić hipotezy zerowej testu. Nie ma wystarczających dowodów, aby stwierdzić, że średnie w obu populacjach znacząco się różnią.

Test T Welcha w programie Excel

Aby wykonać test t Welcha w programie Excel, należy najpierw pobrać darmowy program Analysis ToolPak. Jeśli jeszcze nie pobrałeś go w programie Excel, napisałem krótki poradnik, jak go pobrać .

Po pobraniu pakietu Analysis ToolPak możesz wykonać poniższe kroki, aby wykonać test t Welcha na naszych dwóch próbkach:

1. Wprowadź dane. Wprowadź wartości danych dla dwóch próbek w kolumnach A i B oraz nagłówki Próbka 1 i Próbka 2 w pierwszej komórce każdej kolumny.

2. Wykonaj test t Welcha przy użyciu pakietu Analysis ToolPak. Przejdź do karty Dane na górnej wstążce. Następnie w grupie Analiza kliknij ikonę Analysis ToolPak.

W wyświetlonym oknie dialogowym kliknij test t: dwie próbki przy założeniu nierównych wariancji , a następnie kliknij OK.

Na koniec wpisz poniższe wartości i kliknij OK:

Powinien pojawić się następujący wynik:

Należy pamiętać, że wyniki tego testu odpowiadają wynikom, które uzyskaliśmy ręcznie:

  • Statystyka testowa wynosi -1,5379 .
  • Dwustronna wartość krytyczna wynosi 2,1009 .
  • Ponieważ wartość bezwzględna statystyki testowej nie jest większa niż dwustronna wartość krytyczna, średnie z obu populacji nie różnią się statystycznie.
  • Co więcej, dwustronna wartość p testu wynosi 0,14, czyli jest większa niż 0,05 i potwierdza, że średnie z obu populacji nie różnią się statystycznie.

Test t Welcha przy użyciu R

Poniższy kod ilustruje sposób przeprowadzenia testu t Welcha dla naszych dwóch próbek przy użyciu statystycznego języka programowania R :

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

Funkcja t.test() wyświetla następujące odpowiednie dane wyjściowe:

  • t: statystyka testowa = -1,5379
  • df : stopnie swobody = 18,137
  • wartość p: wartość p testu dwustronnego = 0,1413
  • 95% przedział ufności : 95% przedział ufności dla prawdziwej różnicy średnich w populacji = (-10,45; 1,61)

Wyniki tego testu odpowiadają wynikom uzyskanym ręcznie i za pomocą Excela: różnica średnich dla tych dwóch populacji nie jest istotna statystycznie na poziomie alfa = 0,05.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *