Test niezależności chi-kwadrat: definicja, wzór i przykład
Test niezależności chi-kwadrat służy do określenia, czy istnieje istotny związek między dwiema zmiennymi kategorycznymi.
W tym samouczku wyjaśniono następujące kwestie:
- Motywacja do wykonania testu chi-kwadrat niezależności.
- Wzór na wykonanie testu niezależności chi-kwadrat.
- Przykład wykonania testu niezależności chi-kwadrat.
Test niezależności chi-kwadrat: motywacja
Test niezależności chi-kwadrat można zastosować do ustalenia, czy istnieje związek między dwiema zmiennymi kategorycznymi w wielu różnych kontekstach. Oto kilka przykładów:
- Chcemy wiedzieć, czy płeć jest powiązana z preferencją partii politycznej. Dlatego przeprowadzamy ankietę wśród 500 wyborców i rejestrujemy ich preferencje dotyczące płci i partii politycznych.
- Chcemy wiedzieć, czy ulubiony kolor danej osoby jest powiązany z jej ulubionym sportem. Przeprowadzamy więc ankietę wśród 100 osób i pytamy, jakie są ich preferencje w odniesieniu do obu opcji.
- Chcemy wiedzieć, czy poziom wykształcenia i stan cywilny są ze sobą powiązane. Dlatego zbieramy dane dotyczące tych dwóch zmiennych na prostej losowej próbie 50 osób.
W każdym z tych scenariuszy chcemy wiedzieć, czy dwie zmienne kategoryczne są ze sobą powiązane. W każdym scenariuszu możemy zastosować test niezależności Chi-kwadrat, aby określić, czy istnieje statystycznie istotny związek między zmiennymi.
Test niezależności chi-kwadrat: wzór
Test niezależności chi-kwadrat wykorzystuje następujące hipotezy zerowe i alternatywne:
- H 0 : (hipoteza zerowa) Te dwie zmienne są niezależne.
- H 1 : (hipoteza alternatywna) Te dwie zmienne nie są niezależne. (tj. są powiązane)
Do obliczenia statystyki testowej Chi-kwadrat x 2 używamy następującego wzoru:
X 2 = Σ(OE) 2 / E
Złoto:
- Σ: to fantazyjny symbol oznaczający „sumę”
- O: obserwowana wartość
- E: wartość oczekiwana
Jeśli wartość p odpowiadająca statystyce testowej X 2 z (#rows-1)*(#columns-1) stopniami swobody jest mniejsza niż wybrany poziom istotności, wówczas można odrzucić hipotezę zerową.
Test niezależności chi-kwadrat: przykład
Załóżmy, że chcemy wiedzieć, czy płeć jest powiązana z preferencją partii politycznej. Bierzemy prostą losową próbę 500 wyborców i pytamy ich o preferencje dotyczące partii politycznych. Wyniki badania prezentuje poniższa tabela:
Republikański | Demokrata | Niezależny | Całkowity | |
Mężczyzna | 120 | 90 | 40 | 250 |
Kobieta | 110 | 95 | 45 | 250 |
Całkowity | 230 | 185 | 85 | 500 |
Wykonaj poniższe kroki, aby przeprowadzić test niezależności chi-kwadrat w celu ustalenia, czy płeć jest powiązana z preferencjami partii politycznych.
Krok 1: Zdefiniuj założenia.
Test niezależności Chi-kwadrat przeprowadzimy przy następujących założeniach:
- H 0 : Preferencje dotyczące płci i partii politycznych są niezależne.
- H 1 : Płeć i preferencje partii politycznych nie są niezależne.
Krok 2: Oblicz oczekiwane wartości.
Następnie obliczymy oczekiwane wartości dla każdej komórki w tabeli kontyngencji, korzystając z następującego wzoru:
Oczekiwana wartość = (suma wierszy * suma kolumn) / suma tabeli.
Na przykład oczekiwana wartość dla mężczyzn z Partii Republikańskiej wynosi: (230*250) / 500 = 115 .
Możemy powtórzyć tę formułę, aby uzyskać oczekiwaną wartość dla każdej komórki tabeli:
Republikański | Demokrata | Niezależny | Całkowity | |
Mężczyzna | 115 | 92,5 | 42,5 | 250 |
Kobieta | 115 | 92,5 | 42,5 | 250 |
Całkowity | 230 | 185 | 85 | 500 |
Krok 3: Oblicz (OE) 2 /E dla każdej komórki w tabeli.
Następnie obliczymy (OE) 2 /E dla każdej komórki w tabeli, gdzie:
- O: obserwowana wartość
- E: wartość oczekiwana
Na przykład liczba Republikanów płci męskiej miałaby wartość: (120-115) 2 /115 = 0,2174 .
Możemy powtórzyć tę formułę dla każdej komórki w tabeli:
Republikański | Demokrata | Niezależny | |
Mężczyzna | 0,2174 | 0,0676 | 0,1471 |
Kobieta | 0,2174 | 0,0676 | 0,1471 |
Krok 4: Oblicz statystykę testową X2 i odpowiadającą jej wartość p.
X 2 = σ (OE) 2 / E = 0,2174 + 0,2174 + 0,0676 + 0,0676 + 0,1471 + 0,1471 = 0,8642
Według kalkulatora wyniku chi-kwadrat dla wartości P , wartość p związana z X 2 = 0,8642 i (2-1)*(3-1) = 2 stopniami swobody wynosi 0,649198 .
Krok 5: Wyciągnij wnioski.
Ponieważ ta wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że istnieje związek między płcią a preferencjami partii politycznych.
Uwaga: Możesz także wykonać cały test, korzystając po prostu z kalkulatora testu niezależności chi-kwadrat .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak przeprowadzić test niezależności chi-kwadrat przy użyciu różnych programów statystycznych:
Jak wykonać test niezależności chi-kwadrat w Stata
Jak wykonać test niezależności chi-kwadrat w programie Excel
Jak wykonać test niezależności chi-kwadrat w SPSS
Jak wykonać test niezależności chi-kwadrat w Pythonie
Jak wykonać test niezależności chi-kwadrat w R
Test niezależności chi-kwadrat na kalkulatorze TI-84
Test chi-kwadrat kalkulatora niezależności