Тест независимости хи-квадрат в r (с примерами)
Критерий независимости хи-квадрат используется для определения наличия значимой связи между двумя категориальными переменными .
В этом руководстве объясняется, как выполнить тест независимости хи-квадрат в R.
Пример: критерий хи-квадрат на независимость в R
Предположим, мы хотим знать, связан ли пол с предпочтением той или иной политической партии. Мы берем простую случайную выборку из 500 избирателей и спрашиваем их об их предпочтениях в отношении политических партий. В следующей таблице представлены результаты опроса:
республиканец | Демократ | Независимый | Общий | |
Мужской | 120 | 90 | 40 | 250 |
Женский | 110 | 95 | 45 | 250 |
Общий | 230 | 185 | 85 | 500 |
Используйте следующие шаги, чтобы выполнить критерий независимости хи-квадрат в R, чтобы определить, связан ли пол с предпочтениями политической партии.
Шаг 1: Создайте данные.
Сначала мы создадим таблицу для хранения наших данных:
#create table data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE ) colnames(data) <- c(" Rep "," Dem "," Ind ") rownames(data) <- c(" Male "," Female ") data <- as.table (data) #view table data Rep Dem Ind Male 120 90 40 Female 110 95 45
Шаг 2: Выполните тест независимости хи-квадрат.
Далее мы можем выполнить тест независимости хи-квадрат, используя функцию chisq.test() :
#Perform Chi-Square Test of Independence
chisq.test(data)
Pearson's Chi-squared test
data:data
X-squared = 0.86404, df = 2, p-value = 0.6492
Интерпретация результата следующая:
- Статистика теста хи-квадрат: 0,86404
- Степени свободы: 2 (рассчитывается как #rows-1 * #columns-1)
- p-значение: 0,6492
Напомним, что критерий независимости хи-квадрат использует следующие нулевые и альтернативные гипотезы:
- H 0 : (нулевая гипотеза) Обе переменные независимы.
- H 1 : (альтернативная гипотеза) Эти две переменные не являются независимыми.
Поскольку значение p (0,6492) теста не менее 0,05, мы не можем отвергнуть нулевую гипотезу. Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что существует связь между полом и предпочтениями политических партий.
Другими словами, предпочтения пола и политических партий независимы.
Дополнительные ресурсы
Введение в тест независимости хи-квадрат
Калькулятор критерия независимости хи-квадрат
Как рассчитать значение P статистики хи-квадрат в R
Как найти критическое значение хи-квадрата в R