Test niezależności chi-kwadrat w r (z przykładami)
Test niezależności chi-kwadrat służy do określenia, czy istnieje istotny związek między dwiema zmiennymi kategorycznymi .
W tym samouczku wyjaśniono, jak wykonać test niezależności chi-kwadrat w języku R.
Przykład: test chi-kwadrat niezależności w R
Załóżmy, że chcemy wiedzieć, czy płeć jest powiązana z preferencją partii politycznej. Bierzemy prostą losową próbę 500 wyborców i pytamy ich o preferencje dotyczące partii politycznych. Wyniki badania prezentuje poniższa tabela:
Republikański | Demokrata | Niezależny | Całkowity | |
Mężczyzna | 120 | 90 | 40 | 250 |
Kobieta | 110 | 95 | 45 | 250 |
Całkowity | 230 | 185 | 85 | 500 |
Wykonaj poniższe kroki, aby przeprowadzić test niezależności chi-kwadrat w R w celu ustalenia, czy płeć jest powiązana z preferencjami partii politycznych.
Krok 1: Utwórz dane.
Najpierw utworzymy tabelę do przechowywania naszych danych:
#create table data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE ) colnames(data) <- c(" Rep "," Dem "," Ind ") rownames(data) <- c(" Male "," Female ") data <- as.table (data) #view table data Rep Dem Ind Male 120 90 40 Female 110 95 45
Krok 2: Wykonaj test niezależności chi-kwadrat.
Następnie możemy wykonać test niezależności chi-kwadrat za pomocą funkcji chisq.test() :
#Perform Chi-Square Test of Independence
chisq.test(data)
Pearson's Chi-squared test
data:data
X-squared = 0.86404, df = 2, p-value = 0.6492
Sposób interpretacji wyniku jest następujący:
- Statystyka testu chi-kwadrat: 0,86404
- Stopnie swobody: 2 (obliczane jako #rows-1 * #columns-1)
- Wartość p: 0,6492
Przypomnijmy, że w teście niezależności chi-kwadrat wykorzystuje się następujące hipotezy zerowe i alternatywne:
- H 0 : (hipoteza zerowa) Te dwie zmienne są niezależne.
- H 1 : (hipoteza alternatywna) Te dwie zmienne nie są niezależne.
Ponieważ wartość p (0,6492) testu jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że istnieje związek między płcią a preferencjami partii politycznych.
Innymi słowy, preferencje dotyczące płci i partii politycznych są niezależne.
Dodatkowe zasoby
Wprowadzenie do testu niezależności chi-kwadrat
Test chi-kwadrat kalkulatora niezależności
Jak obliczyć wartość P statystyki chi-kwadrat w R
Jak znaleźć krytyczną wartość chi-kwadrat w R