Як виконати тест відповідності хі-квадрат у stata


Тест відповідності хі-квадрат використовується для визначення того, чи відповідає категоріальна змінна гіпотетичному розподілу.

У цьому посібнику пояснюється, як виконати тест відповідності хі-квадрат у Stata.

Приклад: тест хі-квадрат відповідності в Stata

Щоб проілюструвати, як виконати цей тест, ми використаємо набір даних під назвою nlsw88 , який містить інформацію про статистику зайнятості жінок у Сполучених Штатах у 1988 році.

Виконайте наступні кроки, щоб виконати тест на відповідність хі-квадрат, щоб визначити, чи справжній розподіл раси в цьому наборі даних є таким: 70% білих, 20% чорних, 10% інших.

Крок 1. Завантажте та відобразіть необроблені дані.

Спочатку ми завантажимо дані, ввівши таку команду:

система nlsw88

Ми можемо переглянути необроблені дані, ввівши таку команду:

бр

Перегляд необроблених даних у Stata

Кожен рядок відображає інформацію про особу, включаючи її вік, расу, сімейний стан, рівень освіти та інші фактори.

Крок 2. Завантажте пакет коригування.

Щоб виконати тест на придатність, нам потрібно буде встановити пакет csgof . Ми можемо зробити це, ввівши таку команду:

знайти csgof

З’явиться нове вікно. Натисніть посилання csgof із https://stats.idre.ucla.edu/stat/stata/ado/analysis .

З’явиться інше вікно. Клацніть посилання з написом Натисніть тут, щоб установити .

Встановлення пакета займе всього кілька секунд.

Крок 3: Виконайте перевірку придатності.

Після встановлення пакета ми можемо виконати тест на відповідність даних, щоб визначити, чи справжня расова розбивка така: 70% білих, 20% чорних, 10% інших.

Для виконання тесту ми будемо використовувати такий синтаксис:

csgof variable_of_interest, expperc(list_of_expected_percentages)

Ось точний синтаксис, який ми будемо використовувати в нашому випадку:

запустити csgof, expperc(70, 20, 10)

Відповідність хі-квадрат у Stata

Ось як інтерпретувати результат:

Підсумкове поле: у цьому полі показано очікуваний відсоток, очікувану частоту та спостережувану частоту для кожної раси. Наприклад:

  • Очікуваний відсоток білих особин становив 70%. Це той відсоток, який ми вказали.
  • Очікувана частота білих особин становила 1572,2. Це обчислюється з урахуванням того факту, що в наборі даних було 2246 осіб, тож 70% цієї кількості становить 1572,2.
  • Спостережена частота білих особин становила 1637. Це фактична кількість білих особин у наборі даних.

Chisq(2): Це статистика тесту хі-квадрат для тесту відповідності. Виходить 218,13.

p: це p-значення, пов’язане зі статистикою хі-квадрат. Виявляється, що воно дорівнює 0. Оскільки воно менше 0,05, ми не можемо відхилити нульову гіпотезу про те, що справжній расовий розподіл становить 70% білих, 20% чорних і 10% інших. Ми маємо достатньо доказів, щоб зробити висновок, що справжній расовий розподіл відрізняється від цього гіпотетичного.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *