Как выполнить тест независимости хи-квадрат в stata
Критерий независимости хи-квадрат используется для определения наличия значимой связи между двумя категориальными переменными.
В этом руководстве объясняется, как выполнить тест независимости по хи-квадрату в Stata.
Пример: критерий независимости хи-квадрат в Stata
В этом примере мы будем использовать набор данных auto , который содержит информацию о 74 различных автомобилях 1978 года.
Выполните следующие шаги, чтобы выполнить критерий независимости хи-квадрат и определить, существует ли значительная связь между следующими двумя переменными:
- Rep78: количество ремонтов автомобиля в 1978 году (варьируется от 1 до 5)
- иностранный: является ли тип автомобиля иностранным или нет (0 = нет, 1 = да)
Шаг 1. Загрузите и отобразите необработанные данные.
Сначала мы загрузим данные, введя следующую команду:
автоматическое использование системы
Мы можем просмотреть необработанные данные, введя следующую команду:
бр
В каждой строке отображается информация об отдельном автомобиле, включая цену, расход миль на галлон, вес, длину и другие переменные. Единственные две переменные, которые нас интересуют, — это Rep78 и Foreign .
Шаг 3: Выполните тест независимости хи-квадрат.
Для выполнения теста мы будем использовать следующий синтаксис:
вкладка первая_переменная вторая_переменная, chi2
Вот точный синтаксис, который мы будем использовать в нашем случае:
зарубежная репутация78 вкладка, chi2
Вот как интерпретировать результат:
Сводная таблица: В этой таблице показано общее количество каждой комбинации Rep78 и иностранных файлов . Например
- В 1978 году было 2 отечественных автомобиля и 1 ремонт.
- В 1978 году было 8 отечественных автомобилей, 2 из них прошли ремонт.
- В 1978 году было 27 отечественных автомобилей, прошедших 3 ремонта.
И так далее.
Пирсона chisq(4): это статистика критерия хи-квадрат для теста. Получается 27.2640.
Pr: Это значение p, связанное со статистикой теста хи-квадрат. Получается 0,000. Поскольку это значение меньше 0,05, мы не можем отвергнуть нулевую гипотезу о независимости этих двух переменных. У нас достаточно доказательств, чтобы заключить, что существует статистически значимая связь между тем, является ли автомобиль иностранным или нет, и общим количеством ремонтов, которые он претерпел.