Test chi-kwadrat i test t: jaka jest różnica?
Testy chi-kwadrat i testy t to dwa najpopularniejsze typy testów statystycznych. Dlatego ważne jest, aby zrozumieć różnicę między tymi dwoma testami i wiedzieć, kiedy zastosować każdy z nich, w zależności od problemu, na który chcesz odpowiedzieć.
Ten samouczek zawiera proste wyjaśnienie różnic między tymi dwoma testami, a także tego, kiedy z nich korzystać.
Test chi-kwadrat
W rzeczywistości istnieje kilka różnych wersji testu chi-kwadrat, ale najpowszechniejszym jest test niezależności chi-kwadrat .
Definicja
Testu chi-kwadrat niezależności używamy, gdy chcemy formalnie sprawdzić, czy istnieje statystycznie istotny związek między dwiema zmiennymi kategorycznymi.
Hipotezy testowe są następujące:
Hipoteza zerowa (H 0 ): Nie ma istotnego związku pomiędzy tymi dwiema zmiennymi.
Hipoteza alternatywna: (Ha): Istnieje istotny związek pomiędzy tymi dwiema zmiennymi.
Przykłady
Oto kilka przykładów, kiedy możemy zastosować test chi-kwadrat dla niezależności:
Przykład 1: Chcemy wiedzieć, czy istnieje statystycznie istotny związek pomiędzy płcią (mężczyzna, kobieta) a preferencjami dotyczącymi partii politycznych (Republikanie, Demokraci, Niezależni). Aby to przetestować, moglibyśmy przeprowadzić ankietę wśród 100 losowych osób i zarejestrować ich preferencje dotyczące płci i partii politycznych. Następnie możemy wykonać test chi-kwadrat, aby określić, czy istnieje statystycznie istotny związek między płcią a preferencjami partii politycznych.
Przykład 2: Chcemy wiedzieć, czy istnieje statystycznie istotny związek pomiędzy poziomem klasy (student, student drugiego roku, junior, senior) a ulubionym gatunkiem filmowym (thriller, dramat, western). Aby to przetestować, mogliśmy przeprowadzić ankietę wśród 100 losowych uczniów z każdego poziomu klasy w określonej szkole i nagrać ich ulubiony gatunek filmowy. Następnie możemy przeprowadzić test niezależności chi-kwadrat, aby ustalić, czy istnieje statystycznie istotny związek między poziomem ocen a ulubionym gatunkiem filmowym.
Przykład 3: Chcemy wiedzieć, czy istnieje statystycznie istotny związek pomiędzy ulubionym sportem danej osoby (koszykówka, baseball, piłka nożna) a miejscem dorastania (miasto, wieś). Aby to przetestować, mogliśmy przeprowadzić ankietę wśród 100 przypadkowych osób i zapytać ich, w jakim miejscu dorastali i jaki jest ich ulubiony sport. Następnie możemy wykonać test chi-kwadrat, aby określić, czy istnieje statystycznie istotny związek między ulubionym sportem danej osoby a miejscem jej dorastania.
Hipotezy
Zanim będziemy mogli przeprowadzić test chi-kwadrat na niezależność, musimy najpierw upewnić się, że spełnione są następujące założenia, aby zapewnić ważność naszego testu:
- Losowe: Do zebrania danych z obu próbek należy zastosować próbkę losową lub eksperyment losowy.
- Kategoryczne: Zmienne, które badamy, muszą być kategoryczne.
- Rozmiar: oczekiwana liczba obserwacji na każdym poziomie zmiennej musi wynosić co najmniej 5.
Jeśli te założenia zostaną zweryfikowane, będziemy mogli przeprowadzić test.
test t
Istnieje również kilka różnych wersji testu t, ale najpowszechniejszym jest test t dla różnicy średnich .
Definicja
Testu t używamy do określenia różnicy średnich , gdy chcemy formalnie sprawdzić, czy istnieje statystycznie istotna różnica między dwiema średnimi z populacji.
Hipotezy testowe są następujące:
Hipoteza zerowa (H 0 ): Średnie z dwóch populacji są równe.
Hipoteza alternatywna: (Ha): Średnie w obu populacjach nie są równe.
Uwaga: Można sprawdzić, czy średnia jednej populacji jest wyższa, czy niższa od drugiej, ale najczęstszą hipotezą zerową jest to, że obie średnie są równe.
Przykłady
Oto kilka przykładów sytuacji, w których możemy zastosować test t dla różnicy średnich:
Przykład 1: Chcemy wiedzieć, czy dieta A czy dieta B powoduje większą utratę wagi. Losowo przydzielamy 100 osób do stosowania diety A przez dwa miesiące i kolejnych 100 osób do stosowania diety B przez dwa miesiące. Możemy wykonać test t, aby określić, czy istnieje statystycznie istotna różnica w średniej utracie masy ciała pomiędzy obiema grupami.
Przykład 2: Chcemy wiedzieć, czy dwa różne plany nauki prowadzą do różnych wyników egzaminów dla uczniów. Losowo przydzielamy 50 uczniów do korzystania z jednego planu nauki i 50 uczniów do korzystania z innego planu nauki przez miesiąc poprzedzający egzamin. Możemy wykonać test t, aby określić różnicę w średnich i ustalić, czy istnieje statystycznie istotna różnica w średnich wynikach egzaminów pomiędzy dwoma planami studiów.
Przykład 3: Chcemy wiedzieć, czy uczniowie w dwóch różnych szkołach mają ten sam średni wzrost. Mierzymy wzrost 100 losowych uczniów z jednej szkoły i 100 losowych uczniów z innej szkoły. Możemy wykonać test t dla różnicy średnich, aby określić, czy istnieje statystycznie istotna różnica w średnim wzroście uczniów pomiędzy obiema szkołami.
Hipotezy
Zanim będziemy mogli przeprowadzić test hipotezy na różnicy między dwiema średnimi populacji, musimy najpierw upewnić się, że spełnione są następujące warunki, aby zapewnić ważność naszego testu hipotezy:
- Losowe: Do zebrania danych dla obu próbek należy zastosować próbkę losową lub eksperyment losowy.
- Normalny: rozkład próbkowania jest normalny lub w przybliżeniu normalny.
- Niezależność: Obie próbki są niezależne.
Jeśli te założenia są spełnione, możemy przeprowadzić test hipotezy.
Jak wiedzieć, kiedy zastosować każdy test
Oto krótkie podsumowanie każdego testu:
Test niezależności chi-kwadrat: umożliwia sprawdzenie, czy istnieje statystycznie istotny związek pomiędzy dwiema zmiennymi kategorycznymi . Kiedy odrzucasz hipotezę zerową na podstawie testu niezależności chi-kwadrat, oznacza to, że istnieje istotny związek między obiema zmiennymi.
Test t różnicy średnich: umożliwia sprawdzenie, czy istnieje statystycznie istotna różnica między średnimi z dwóch populacji. Kiedy odrzucasz hipotezę zerową testu t dla różnicy średnich, oznacza to, że średnie z dwóch populacji nie są równe.
Najłatwiejszym sposobem sprawdzenia, czy zastosować test chi-kwadrat w porównaniu z testem t, jest po prostu spojrzenie na typy zmiennych, z którymi pracujesz.
Jeśli masz dwie zmienne, które są kategoryczne, to znaczy, że można je umieścić w kategoriach takich jak mężczyzna , kobieta i Republikańska , Demokratyczna , niezależna , powinieneś użyć testu chi-kwadrat.
Jeśli jednak jedna zmienna ma charakter kategoryczny (np. rodzaj planu nauki – albo plan 1, albo plan 2), a druga ma charakter ciągły (np. wynik egzaminu – mierzony od 0 do 100), wówczas należy zastosować test t.