Jaka jest różnica między testem t a anova?
W tym samouczku wyjaśniono różnicę między testem t a ANOVA , a także kiedy stosować każdy test.
Test T
Test t służy do określenia, czy istnieje statystycznie istotna różnica między średnimi z dwóch grup . Istnieją dwa rodzaje testów t:
1. Test t dla niezależnych próbek. Stosuje się to, gdy chcemy porównać różnicę między średnimi dwóch grup, a grupy są od siebie całkowicie niezależne.
Na przykład badacze mogą chcieć wiedzieć, czy dieta A czy dieta B pomaga ludziom schudnąć. 100 losowo przydzielonych osób przypisano do diety A. Kolejnych 100 losowo przydzielonych osób przydzielono do diety B. Po trzech miesiącach badacze rejestrują całkowitą utratę wagi każdej osoby. Aby ustalić, czy średnia utrata masy ciała w obu grupach znacznie się różni, badacze mogą przeprowadzić test t dla niezależnych próbek.
2. Test t dla sparowanych próbek . Używa się tego, gdy chcemy porównać różnicę między średnimi z dwóch grup i gdy każdą obserwację z jednej grupy można powiązać z obserwacją z drugiej grupy.
Załóżmy na przykład, że 20 uczniów w klasie przystępuje do testu, następnie studiuje określony przewodnik, a następnie ponownie podchodzi do testu. Aby porównać różnicę między wynikami pierwszego i drugiego testu, używamy testu t dla par, ponieważ w przypadku każdego ucznia wynik pierwszego testu można powiązać z wynikiem drugiego testu.
Aby test t dał prawidłowe wyniki, muszą zostać spełnione następujące założenia:
- Losowe: Do zebrania danych dla obu próbek należy zastosować próbkę losową lub eksperyment losowy.
- Normalny: rozkład próbkowania jest normalny lub w przybliżeniu normalny.
Jeśli te założenia są spełnione, można zastosować test t w celu sprawdzenia różnicy między średnimi z dwóch grup.
ANOVA
Do określenia, czy istnieje statystycznie istotna różnica pomiędzy średnimi z trzech lub więcej grup, stosuje się ANOVA (analizę wariancji). Najczęściej stosowanymi w praktyce testami ANOVA są jednokierunkowa ANOVA i dwukierunkowa ANOVA:
Jednoczynnikowa analiza ANOVA: stosowana do sprawdzania, czy istnieje statystycznie istotna różnica pomiędzy średnimi z trzech lub większej liczby grup, gdy grupy można podzielić na podstawie jednego czynnika .
Przykład: Losowo dzielisz klasę składającą się z 90 uczniów na trzy grupy po 30 osób. Każda grupa przez miesiąc wykorzystuje inną technikę nauki, aby przygotować się do egzaminu. Pod koniec miesiąca wszyscy uczniowie przystępują do tego samego egzaminu. Chcesz wiedzieć, czy technika nauki ma wpływ na wyniki egzaminu. Wykonujesz zatem jednoczynnikową analizę ANOVA, aby określić, czy istnieje statystycznie istotna różnica między średnimi wynikami trzech grup.
Dwuczynnikowa ANOVA: Stosowana do sprawdzania, czy istnieje statystycznie istotna różnica pomiędzy średnimi z trzech lub więcej grup, gdy grupy można podzielić na dwa czynniki .
Przykład: Chcesz ustalić, czy poziom ćwiczeń (brak ćwiczeń, lekkie ćwiczenia, energiczne ćwiczenia) i płeć (mężczyzna, kobieta) mają wpływ na utratę wagi. W tym przypadku badane czynniki to aktywność fizyczna i płeć, a zmienną odpowiedzi jest utrata masy ciała (mierzona w funtach). Można przeprowadzić dwuczynnikową analizę ANOVA, aby określić, czy ćwiczenia fizyczne i płeć wpływają na utratę wagi oraz czy istnieje interakcja między ćwiczeniami fizycznymi a płcią na utratę wagi.
Aby analiza ANOVA dała prawidłowe wyniki, muszą zostać spełnione następujące założenia:
- Normalność – wszystkie badane przez nas populacje mają rozkład normalny. Jeśli więc na przykład chcemy porównać wyniki egzaminów trzech różnych grup uczniów, wyniki egzaminów pierwszej, drugiej i trzeciej grupy powinny mieć rozkład normalny.
- Równa wariancja – wariancje populacji w każdej grupie są równe lub w przybliżeniu równe.
- Niezależność – obserwacje każdej grupy muszą być od siebie niezależne. Zwykle rozwiązuje to losowy projekt .
Jeśli te założenia są spełnione, możliwe jest zastosowanie analizy ANOVA do przetestowania różnicy między średnimi z trzech lub więcej grup.
Poznaj różnice między każdym testem
Główna różnica między testem t a ANOVA polega na tym, jak oba testy obliczają statystykę testową, aby określić, czy istnieje statystycznie istotna różnica między grupami.
Test t niezależnych próbek wykorzystuje następującą statystykę testową:
statystyka testowa t = [ ( x 1 – x 2 ) – re ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )
gdzie x 1 i x 2 to średnie z próby dla grup 1 i 2, d to hipotetyczna różnica między dwiema średnimi (często wynosi zero), s 1 2 i s 2 2 to wariancje próbek dla grup 1 i 2 oraz n 1 i n 2 to wielkości próbek odpowiednio dla grup 1 i 2.
Test t dla par próbek wykorzystuje następującą statystykę testową:
statystyka testowa t = d / (s d / √n)
gdzie d to średnia różnica między dwiema grupami, s d to odchylenie standardowe różnic, a n to wielkość próby dla każdej grupy (należy pamiętać, że obie grupy będą miały tę samą wielkość próby).
W analizie ANOVA wykorzystuje się następującą statystykę testową:
statystyka testowa F = s 2 b / s 2 w
gdzie s 2 b to wariancja między próbami, a s 2 w to wariancja wewnątrz próbki.
Test t mierzy stosunek średniej różnicy między dwiema grupami do całkowitego odchylenia standardowego różnic. Jeśli stosunek ten jest wystarczająco wysoki, jest to wystarczający dowód na to, że istnieje znacząca różnica między obiema grupami.
Z drugiej strony ANOVA mierzy stosunek wariancji między grupami w porównaniu do wariancji wewnątrz grup. Podobnie jak w przypadku testu t, jeśli ten stosunek jest wystarczająco wysoki, dostarcza wystarczających dowodów na to, że trzy grupy nie mają tej samej średniej.
Inną kluczową różnicą między testem t a ANOVA jest to, że test t może nam powiedzieć, czy dwie grupy mają tę samą średnią. Z drugiej strony analiza ANOVA mówi nam, czy wszystkie trzy grupy mają tę samą średnią, ale nie mówi nam wyraźnie, które grupy mają różne średnie od siebie.
Aby dowiedzieć się, które grupy różnią się od siebie, konieczne byłoby przeprowadzenie testów post hoc .
Dowiedz się, kiedy używać każdego testu
W praktyce, gdy chcemy porównać średnie dwóch grup , stosujemy test t. Kiedy chcemy porównać średnie z trzech lub więcej grup , używamy ANOVA.
Podstawowym powodem, dla którego nie używamy po prostu wielu testów t do porównania średnich z trzech lub więcej grup, jest zrozumienie współczynnika błędów typu I. Załóżmy, że chcemy porównać średnie trzech grup: grupy A, grupy B i grupy C. Możesz pokusić się o wykonanie następujących trzech testów t:
- Test t w celu porównania różnicy średnich między grupą A i grupą B
- Test t w celu porównania różnicy średnich między grupą A i grupą C
- Test t w celu porównania różnicy średnich między grupą B i grupą C
W każdym teście t istnieje prawdopodobieństwo, że popełnimy błąd I rodzaju , czyli prawdopodobieństwo, że odrzucimy hipotezę zerową, gdy jest ona rzeczywiście prawdziwa. Prawdopodobieństwo to wynosi zazwyczaj 5%. Oznacza to, że gdy wykonujemy wiele testów t, poziom błędu wzrasta. Na przykład:
- Prawdopodobieństwo, że popełnimy błąd pierwszego rodzaju w pojedynczym teście t, wynosi 1 – 0,95 = 0,05 .
- Prawdopodobieństwo, że popełnimy błąd I rodzaju w dwóch testach t, wynosi 1 – (0,95 2 ) = 0,0975 .
- Prawdopodobieństwo, że popełnimy błąd I rodzaju w dwóch testach t, wynosi 1 – (0,95 3 ) = 0,1427 .
Ten poziom błędów jest niedopuszczalnie wysoki. Na szczęście analiza ANOVA kontroluje te błędy, tak że błąd typu I pozostaje jedynie na poziomie 5%. Dzięki temu możemy mieć większą pewność, że statystycznie istotny wynik testu jest rzeczywiście znaczący, a nie tylko wynik uzyskany w wyniku przeprowadzenia wielu testów.
Jeśli więc chcemy zrozumieć, czy istnieje różnica między średnimi z trzech lub więcej grup, musimy zastosować analizę ANOVA, aby nasze wyniki były statystycznie ważne i wiarygodne.