Test niezależności chi-kwadrat: definicja, wzór i przykład


Test niezależności chi-kwadrat służy do określenia, czy istnieje istotny związek między dwiema zmiennymi kategorycznymi.

W tym samouczku wyjaśniono następujące kwestie:

  • Motywacja do wykonania testu chi-kwadrat niezależności.
  • Wzór na wykonanie testu niezależności chi-kwadrat.
  • Przykład wykonania testu niezależności chi-kwadrat.

Test niezależności chi-kwadrat: motywacja

Test niezależności chi-kwadrat można zastosować do ustalenia, czy istnieje związek między dwiema zmiennymi kategorycznymi w wielu różnych kontekstach. Oto kilka przykładów:

  • Chcemy wiedzieć, czy płeć jest powiązana z preferencją partii politycznej. Dlatego przeprowadzamy ankietę wśród 500 wyborców i rejestrujemy ich preferencje dotyczące płci i partii politycznych.
  • Chcemy wiedzieć, czy ulubiony kolor danej osoby jest powiązany z jej ulubionym sportem. Przeprowadzamy więc ankietę wśród 100 osób i pytamy, jakie są ich preferencje w odniesieniu do obu opcji.
  • Chcemy wiedzieć, czy poziom wykształcenia i stan cywilny są ze sobą powiązane. Dlatego zbieramy dane dotyczące tych dwóch zmiennych na prostej losowej próbie 50 osób.

W każdym z tych scenariuszy chcemy wiedzieć, czy dwie zmienne kategoryczne są ze sobą powiązane. W każdym scenariuszu możemy zastosować test niezależności Chi-kwadrat, aby określić, czy istnieje statystycznie istotny związek między zmiennymi.

Test niezależności chi-kwadrat: wzór

Test niezależności chi-kwadrat wykorzystuje następujące hipotezy zerowe i alternatywne:

  • H 0 : (hipoteza zerowa) Te dwie zmienne są niezależne.
  • H 1 : (hipoteza alternatywna) Te dwie zmienne nie są niezależne. (tj. są powiązane)

Do obliczenia statystyki testowej Chi-kwadrat x 2 używamy następującego wzoru:

X 2 = Σ(OE) 2 / E

Złoto:

  • Σ: to fantazyjny symbol oznaczający „sumę”
  • O: obserwowana wartość
  • E: wartość oczekiwana

Jeśli wartość p odpowiadająca statystyce testowej X 2 z (#rows-1)*(#columns-1) stopniami swobody jest mniejsza niż wybrany poziom istotności, wówczas można odrzucić hipotezę zerową.

Test niezależności chi-kwadrat: przykład

Załóżmy, że chcemy wiedzieć, czy płeć jest powiązana z preferencją partii politycznej. Bierzemy prostą losową próbę 500 wyborców i pytamy ich o preferencje dotyczące partii politycznych. Wyniki badania prezentuje poniższa tabela:

Republikański Demokrata Niezależny Całkowity
Mężczyzna 120 90 40 250
Kobieta 110 95 45 250
Całkowity 230 185 85 500

Wykonaj poniższe kroki, aby przeprowadzić test niezależności chi-kwadrat w celu ustalenia, czy płeć jest powiązana z preferencjami partii politycznych.

Krok 1: Zdefiniuj założenia.

Test niezależności Chi-kwadrat przeprowadzimy przy następujących założeniach:

  • H 0 : Preferencje dotyczące płci i partii politycznych są niezależne.
  • H 1 : Płeć i preferencje partii politycznych nie są niezależne.

Krok 2: Oblicz oczekiwane wartości.

Następnie obliczymy oczekiwane wartości dla każdej komórki w tabeli kontyngencji, korzystając z następującego wzoru:

Oczekiwana wartość = (suma wierszy * suma kolumn) / suma tabeli.

Na przykład oczekiwana wartość dla mężczyzn z Partii Republikańskiej wynosi: (230*250) / 500 = 115 .

Możemy powtórzyć tę formułę, aby uzyskać oczekiwaną wartość dla każdej komórki tabeli:

Republikański Demokrata Niezależny Całkowity
Mężczyzna 115 92,5 42,5 250
Kobieta 115 92,5 42,5 250
Całkowity 230 185 85 500

Krok 3: Oblicz (OE) 2 /E dla każdej komórki w tabeli.

Następnie obliczymy (OE) 2 /E dla każdej komórki w tabeli, gdzie:

  • O: obserwowana wartość
  • E: wartość oczekiwana

Na przykład liczba Republikanów płci męskiej miałaby wartość: (120-115) 2 /115 = 0,2174 .

Możemy powtórzyć tę formułę dla każdej komórki w tabeli:

Republikański Demokrata Niezależny
Mężczyzna 0,2174 0,0676 0,1471
Kobieta 0,2174 0,0676 0,1471

Krok 4: Oblicz statystykę testową X2 i odpowiadającą jej wartość p.

X 2 = σ (OE) 2 / E = 0,2174 + 0,2174 + 0,0676 + 0,0676 + 0,1471 + 0,1471 = 0,8642

Według kalkulatora wyniku chi-kwadrat dla wartości P , wartość p związana z X 2 = 0,8642 i (2-1)*(3-1) = 2 stopniami swobody wynosi 0,649198 .

Krok 5: Wyciągnij wnioski.

Ponieważ ta wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że istnieje związek między płcią a preferencjami partii politycznych.

Uwaga: Możesz także wykonać cały test, korzystając po prostu z kalkulatora testu niezależności chi-kwadrat .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak przeprowadzić test niezależności chi-kwadrat przy użyciu różnych programów statystycznych:

Jak wykonać test niezależności chi-kwadrat w Stata
Jak wykonać test niezależności chi-kwadrat w programie Excel
Jak wykonać test niezależności chi-kwadrat w SPSS
Jak wykonać test niezależności chi-kwadrat w Pythonie
Jak wykonać test niezależności chi-kwadrat w R
Test niezależności chi-kwadrat na kalkulatorze TI-84
Test chi-kwadrat kalkulatora niezależności

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *