Test t welcha: kiedy go stosować + przykłady

Przez Benjamin Anderson 29 lipca, 2023 Przewodnik 0 komentarzy

Gdy chcemy porównać średnie dwóch niezależnych grup, możemy wybrać pomiędzy zastosowaniem dwóch różnych testów:

Test t-Studenta: W tym teście zakłada się, że dwie grupy danych są próbkowane z populacji o rozkładzie normalnym i że obie populacje mają tę samą wariancję.

Test t Welcha: w tym teście zakłada się, że obie grupy danych są próbkowane z populacji o rozkładzie normalnym, ale nie zakłada, że te dwie populacje mają tę samą wariancję .

Różnica między testem t-Studenta a testem t-Studenta

Istnieją dwie różnice w sposobie wykonywania testu t-Studenta i testu t-Studenta:

Statystyka testowa
Stopnie swobody

Test t-Studenta:

Statystyka testowa: ( x ₁ – x ₂ ) / s _p (√ 1/n ₁ + 1/n ₂ )

gdzie x ₁ i x ₂ to średnie próbki, n ₁ i n ₂ to wielkości próbek, odpowiednio dla próbki 1 i próbki 2, oraz gdzie _sp oblicza się w następujący sposób:

s _p = √ (n ₁ -1) s ₁ ² + (n ₂ -1) s ₂ ² / (n ₁ + n ₂ -2)

gdzie s ₁ ² i s ₂ ² są wariancjami próbki.

Stopnie swobody: n ₁ + n ₂ – 2

Test T Welcha

Statystyka testowa: ( x ₁ – x ₂ ) / (√ s ₁ ² /n ₁ + s ₂ ² /n ₂ )

Stopnie swobody: (s ₁ ² /n ₁ + s ₂ ² /n ₂ ) ² / { [ (s ₁ ² / n ₁ ) ² / (n ₁ – 1) ] + [ (s ₂ ² / n ₂ ) ² / (n ₂ – 1) ] }

Wzór na obliczenie stopni swobody testu t Welcha uwzględnia różnicę między dwoma odchyleniami standardowymi. Jeżeli obie próbki mają takie same odchylenia standardowe, wówczas stopnie swobody testu t-Studenta będą dokładnie takie same, jak stopnie swobody testu t-Studenta.

Zazwyczaj odchylenia standardowe dla dwóch próbek nie są takie same i dlatego stopnie swobody testu t-Studenta są zwykle mniejsze niż stopnie swobody testu t-Studenta.

Należy również zauważyć, że stopnie swobody w teście t Welcha na ogół nie są liczbami całkowitymi. Jeśli testujesz ręcznie, najlepiej zaokrąglić do najniższej liczby całkowitej. Jeśli użyjesz oprogramowania statystycznego, takiego jak R , oprogramowanie będzie w stanie podać dziesiętną wartość stopni swobody.

Kiedy należy zastosować test t Welcha?

Niektórzy twierdzą, że test t Welcha powinien być domyślnym wyborem do porównywania średnich dwóch niezależnych grup, ponieważ sprawdza się lepiej niż test t-Studenta, gdy liczebność próbek i wariancje są nierówne pomiędzy grupami, a także daje identyczne wyniki, gdy wielkość próbek są różne. różnice są równe.

W praktyce, gdy porównuje się średnie dwóch grup, jest mało prawdopodobne, aby odchylenia standardowe w każdej grupie były takie same. Dlatego dobrym pomysłem jest zawsze używanie testu t Welcha, dzięki czemu nie trzeba przyjmować założeń dotyczących równości wariancji.

Przykłady wykorzystania testu t Welcha

Następnie przeprowadzimy test t Welcha na następujących dwóch próbach, aby określić, czy ich średnie z populacji różnią się istotnie na poziomie istotności 0,05:

Próbka 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

Próbka 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

Zilustrujemy, jak przeprowadzić test na trzy różne sposoby:

Za rękę
Skorzystaj z Microsoft Excela
Użyj statystycznego języka programowania R

Ręcznie wykonany test Welcha

Aby ręcznie wykonać test t Welcha, musimy najpierw znaleźć średnie próbki, wariancje próbek i wielkość próbek:

x1 _– 19.27
x2 _– 23,69
s ₁ ² – 20:42
sztuka ₂ ² – 83.23
# ₁ – 11
# ₂ – 13

Następnie możemy wprowadzić te liczby, aby znaleźć statystykę testową:

Statystyka testowa: ( x ₁ – x ₂ ) / (√ s ₁ ² /n ₁ + s ₂ ² /n ₂ )

Statystyka testowa: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538

Stopnie swobody: (s ₁ ² /n ₁ + s ₂ ² /n ₂ ) ² / { [ (s ₁ ² / n ₁ ) ² / (n ₁ – 1) ] + [ (s ₂ ² / n ₂ ) ² / (n ₂ – 1) ] }

Stopnie swobody: (20,42/11 + 83,23/13) ² / { [ (20,42/11) ² / (11 – 1) ] + [ (83,23/13) ² / (13 – 1) ] } = 18,137. Zaokrąglamy ten wynik do najbliższej liczby całkowitej, 18 .

Na koniec znajdziemy wartość krytyczną t w tabeli rozkładu t, która odpowiada dwustronnemu testowi z alfa = 0,05 dla 18 stopni swobody:

Tablica rozdzielcza T

Wartość krytyczna t wynosi 2,101 . Ponieważ wartość bezwzględna naszej statystyki testowej (1,538) nie jest większa niż wartość krytyczna t, nie udaje nam się odrzucić hipotezy zerowej testu. Nie ma wystarczających dowodów, aby stwierdzić, że średnie w obu populacjach znacząco się różnią.

Test T Welcha w programie Excel

Aby wykonać test t Welcha w programie Excel, należy najpierw pobrać darmowy program Analysis ToolPak. Jeśli jeszcze nie pobrałeś go w programie Excel, napisałem krótki poradnik, jak go pobrać .

Po pobraniu pakietu Analysis ToolPak możesz wykonać poniższe kroki, aby wykonać test t Welcha na naszych dwóch próbkach:

1. Wprowadź dane. Wprowadź wartości danych dla dwóch próbek w kolumnach A i B oraz nagłówki Próbka 1 i Próbka 2 w pierwszej komórce każdej kolumny.

2. Wykonaj test t Welcha przy użyciu pakietu Analysis ToolPak. Przejdź do karty Dane na górnej wstążce. Następnie w grupie Analiza kliknij ikonę Analysis ToolPak.

W wyświetlonym oknie dialogowym kliknij test t: dwie próbki przy założeniu nierównych wariancji , a następnie kliknij OK.

Na koniec wpisz poniższe wartości i kliknij OK:

Powinien pojawić się następujący wynik:

Należy pamiętać, że wyniki tego testu odpowiadają wynikom, które uzyskaliśmy ręcznie:

Statystyka testowa wynosi -1,5379 .
Dwustronna wartość krytyczna wynosi 2,1009 .
Ponieważ wartość bezwzględna statystyki testowej nie jest większa niż dwustronna wartość krytyczna, średnie z obu populacji nie różnią się statystycznie.
Co więcej, dwustronna wartość p testu wynosi 0,14, czyli jest większa niż 0,05 i potwierdza, że średnie z obu populacji nie różnią się statystycznie.

Test t Welcha przy użyciu R

Poniższy kod ilustruje sposób przeprowadzenia testu t Welcha dla naszych dwóch próbek przy użyciu statystycznego języka programowania R :

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

Funkcja t.test() wyświetla następujące odpowiednie dane wyjściowe:

t: statystyka testowa = -1,5379
df : stopnie swobody = 18,137
wartość p: wartość p testu dwustronnego = 0,1413
95% przedział ufności : 95% przedział ufności dla prawdziwej różnicy średnich w populacji = (-10,45; 1,61)

Wyniki tego testu odpowiadają wynikom uzyskanym ręcznie i za pomocą Excela: różnica średnich dla tych dwóch populacji nie jest istotna statystycznie na poziomie alfa = 0,05.

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej