Как выполнить тест независимости хи-квадрат в stata


Критерий независимости хи-квадрат используется для определения наличия значимой связи между двумя категориальными переменными.

В этом руководстве объясняется, как выполнить тест независимости по хи-квадрату в Stata.

Пример: критерий независимости хи-квадрат в Stata

В этом примере мы будем использовать набор данных auto , который содержит информацию о 74 различных автомобилях 1978 года.

Выполните следующие шаги, чтобы выполнить критерий независимости хи-квадрат и определить, существует ли значительная связь между следующими двумя переменными:

  • Rep78: количество ремонтов автомобиля в 1978 году (варьируется от 1 до 5)
  • иностранный: является ли тип автомобиля иностранным или нет (0 = нет, 1 = да)

Шаг 1. Загрузите и отобразите необработанные данные.

Сначала мы загрузим данные, введя следующую команду:

автоматическое использование системы

Мы можем просмотреть необработанные данные, введя следующую команду:

бр

Необработанные данные для автоматического набора данных в Stata

В каждой строке отображается информация об отдельном автомобиле, включая цену, расход миль на галлон, вес, длину и другие переменные. Единственные две переменные, которые нас интересуют, — это Rep78 и Foreign .

Шаг 3: Выполните тест независимости хи-квадрат.

Для выполнения теста мы будем использовать следующий синтаксис:

вкладка первая_переменная вторая_переменная, chi2

Вот точный синтаксис, который мы будем использовать в нашем случае:

зарубежная репутация78 вкладка, chi2

Критерий хи-квадрат независимости вывода в Stata

Вот как интерпретировать результат:

Сводная таблица: В этой таблице показано общее количество каждой комбинации Rep78 и иностранных файлов . Например

  • В 1978 году было 2 отечественных автомобиля и 1 ремонт.
  • В 1978 году было 8 отечественных автомобилей, 2 из них прошли ремонт.
  • В 1978 году было 27 отечественных автомобилей, прошедших 3 ремонта.

И так далее.

Пирсона chisq(4): это статистика критерия хи-квадрат для теста. Получается 27.2640.

Pr: Это значение p, связанное со статистикой теста хи-квадрат. Получается 0,000. Поскольку это значение меньше 0,05, мы не можем отвергнуть нулевую гипотезу о независимости этих двух переменных. У нас достаточно доказательств, чтобы заключить, что существует статистически значимая связь между тем, является ли автомобиль иностранным или нет, и общим количеством ремонтов, которые он претерпел.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *