Test t welcha: kiedy go stosować + przykłady
Gdy chcemy porównać średnie dwóch niezależnych grup, możemy wybrać pomiędzy zastosowaniem dwóch różnych testów:
Test t-Studenta: W tym teście zakłada się, że dwie grupy danych są próbkowane z populacji o rozkładzie normalnym i że obie populacje mają tę samą wariancję.
Test t Welcha: w tym teście zakłada się, że obie grupy danych są próbkowane z populacji o rozkładzie normalnym, ale nie zakłada, że te dwie populacje mają tę samą wariancję .
Różnica między testem t-Studenta a testem t-Studenta
Istnieją dwie różnice w sposobie wykonywania testu t-Studenta i testu t-Studenta:
- Statystyka testowa
- Stopnie swobody
Test t-Studenta:
Statystyka testowa: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
gdzie x 1 i x 2 to średnie próbki, n 1 i n 2 to wielkości próbek, odpowiednio dla próbki 1 i próbki 2, oraz gdzie sp oblicza się w następujący sposób:
s p = √ (n 1 -1) s 1 2 + (n 2 -1) s 2 2 / (n 1 + n 2 -2)
gdzie s 1 2 i s 2 2 są wariancjami próbki.
Stopnie swobody: n 1 + n 2 – 2
Test T Welcha
Statystyka testowa: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Stopnie swobody: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Wzór na obliczenie stopni swobody testu t Welcha uwzględnia różnicę między dwoma odchyleniami standardowymi. Jeżeli obie próbki mają takie same odchylenia standardowe, wówczas stopnie swobody testu t-Studenta będą dokładnie takie same, jak stopnie swobody testu t-Studenta.
Zazwyczaj odchylenia standardowe dla dwóch próbek nie są takie same i dlatego stopnie swobody testu t-Studenta są zwykle mniejsze niż stopnie swobody testu t-Studenta.
Należy również zauważyć, że stopnie swobody w teście t Welcha na ogół nie są liczbami całkowitymi. Jeśli testujesz ręcznie, najlepiej zaokrąglić do najniższej liczby całkowitej. Jeśli użyjesz oprogramowania statystycznego, takiego jak R , oprogramowanie będzie w stanie podać dziesiętną wartość stopni swobody.
Kiedy należy zastosować test t Welcha?
Niektórzy twierdzą, że test t Welcha powinien być domyślnym wyborem do porównywania średnich dwóch niezależnych grup, ponieważ sprawdza się lepiej niż test t-Studenta, gdy liczebność próbek i wariancje są nierówne pomiędzy grupami, a także daje identyczne wyniki, gdy wielkość próbek są różne. różnice są równe.
W praktyce, gdy porównuje się średnie dwóch grup, jest mało prawdopodobne, aby odchylenia standardowe w każdej grupie były takie same. Dlatego dobrym pomysłem jest zawsze używanie testu t Welcha, dzięki czemu nie trzeba przyjmować założeń dotyczących równości wariancji.
Przykłady wykorzystania testu t Welcha
Następnie przeprowadzimy test t Welcha na następujących dwóch próbach, aby określić, czy ich średnie z populacji różnią się istotnie na poziomie istotności 0,05:
Próbka 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
Próbka 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
Zilustrujemy, jak przeprowadzić test na trzy różne sposoby:
- Za rękę
- Skorzystaj z Microsoft Excela
- Użyj statystycznego języka programowania R
Ręcznie wykonany test Welcha
Aby ręcznie wykonać test t Welcha, musimy najpierw znaleźć średnie próbki, wariancje próbek i wielkość próbek:
x1 – 19.27
x2 – 23,69
s 1 2 – 20:42
sztuka 2 2 – 83.23
# 1 – 11
# 2 – 13
Następnie możemy wprowadzić te liczby, aby znaleźć statystykę testową:
Statystyka testowa: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Statystyka testowa: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Stopnie swobody: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Stopnie swobody: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Zaokrąglamy ten wynik do najbliższej liczby całkowitej, 18 .
Na koniec znajdziemy wartość krytyczną t w tabeli rozkładu t, która odpowiada dwustronnemu testowi z alfa = 0,05 dla 18 stopni swobody:
Wartość krytyczna t wynosi 2,101 . Ponieważ wartość bezwzględna naszej statystyki testowej (1,538) nie jest większa niż wartość krytyczna t, nie udaje nam się odrzucić hipotezy zerowej testu. Nie ma wystarczających dowodów, aby stwierdzić, że średnie w obu populacjach znacząco się różnią.
Test T Welcha w programie Excel
Aby wykonać test t Welcha w programie Excel, należy najpierw pobrać darmowy program Analysis ToolPak. Jeśli jeszcze nie pobrałeś go w programie Excel, napisałem krótki poradnik, jak go pobrać .
Po pobraniu pakietu Analysis ToolPak możesz wykonać poniższe kroki, aby wykonać test t Welcha na naszych dwóch próbkach:
1. Wprowadź dane. Wprowadź wartości danych dla dwóch próbek w kolumnach A i B oraz nagłówki Próbka 1 i Próbka 2 w pierwszej komórce każdej kolumny.
2. Wykonaj test t Welcha przy użyciu pakietu Analysis ToolPak. Przejdź do karty Dane na górnej wstążce. Następnie w grupie Analiza kliknij ikonę Analysis ToolPak.
W wyświetlonym oknie dialogowym kliknij test t: dwie próbki przy założeniu nierównych wariancji , a następnie kliknij OK.
Na koniec wpisz poniższe wartości i kliknij OK:
Powinien pojawić się następujący wynik:
Należy pamiętać, że wyniki tego testu odpowiadają wynikom, które uzyskaliśmy ręcznie:
- Statystyka testowa wynosi -1,5379 .
- Dwustronna wartość krytyczna wynosi 2,1009 .
- Ponieważ wartość bezwzględna statystyki testowej nie jest większa niż dwustronna wartość krytyczna, średnie z obu populacji nie różnią się statystycznie.
- Co więcej, dwustronna wartość p testu wynosi 0,14, czyli jest większa niż 0,05 i potwierdza, że średnie z obu populacji nie różnią się statystycznie.
Test t Welcha przy użyciu R
Poniższy kod ilustruje sposób przeprowadzenia testu t Welcha dla naszych dwóch próbek przy użyciu statystycznego języka programowania R :
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test( sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: #-10.453875 1.614714 #sample estimates: #mean of x mean of y #19.27273 23.69231 #
Funkcja t.test() wyświetla następujące odpowiednie dane wyjściowe:
- t: statystyka testowa = -1,5379
- df : stopnie swobody = 18,137
- wartość p: wartość p testu dwustronnego = 0,1413
- 95% przedział ufności : 95% przedział ufności dla prawdziwej różnicy średnich w populacji = (-10,45; 1,61)
Wyniki tego testu odpowiadają wynikom uzyskanym ręcznie i za pomocą Excela: różnica średnich dla tych dwóch populacji nie jest istotna statystycznie na poziomie alfa = 0,05.