Як виконати тест левена в stata
Критерій Левена використовується для визначення того, чи мають дві чи більше групи рівні дисперсії. Це широко використовуваний тест у статистиці, оскільки багато статистичних тестів спираються на припущення, що групи мають однакові дисперсії.
Цей підручник пояснює, як виконати тест Левена в Stata.
Приклад: тест Левена в Stata
Для цього прикладу ми використаємо набір даних про перебування , який містить інформацію про тривалість перебування 1778 різних пацієнтів, госпіталізованих для певної медичної процедури, яка відрізняється за статтю. Набір даних містить 884 чоловіки та 894 жінки.
Виконайте наступні кроки, щоб виконати тест Левена, щоб визначити, чи однакові різниці в тривалості перебування чоловіків і жінок.
Крок 1: Завантажте та відобразіть дані.
Використовуйте наступну команду, щоб завантажити набір даних у Stata.
використовуйте https://www.stata-press.com/data/r13/stay
Відобразіть перші десять рядків даних за допомогою такої команди:
список на 1/10
Перший стовпець відображає тривалість перебування (у днях) особи, а другий стовпець відображає стать особи.
Крок 2: Виконайте тест Левена.
Ми будемо використовувати такий синтаксис для виконання тесту Левена:
robvar вимірювання_змінної, за (групування_змінної)
У нашому випадку ми будемо використовувати такий синтаксис:
Робвар тривалість перебування, за (стать)
Ось як інтерпретувати результат:
Зведена таблиця: у цій таблиці показано середню тривалість перебування, стандартне відхилення тривалості перебування та загальну кількість спостережень для чоловіків і жінок. Ми бачимо, що стандартне відхилення тривалості перебування вище для чоловіків (9,7884747), ніж для жінок (9,1081478), але тест Левена покаже нам, чи є ця різниця статистично значущою чи ні.
W0: 0,55505315 . Це середньоцентрована статистика тесту Левена. Відповідне значення p становить 0,45625888 .
W50: 0,42714734 . Це статистика тесту Левена з центром на медіані. Відповідне значення p становить 0,51347664 .
W10: 0,44577674 . Це статистика тесту Левена, зосереджена на 10% скороченому середньому – тобто верхні 5% і нижні 5% значень скорочуються, щоб не впливати надто на тест. Відповідне значення p становить 0,50443411 .
Незалежно від того, яку версію тесту Левена ви використовуєте, p-значення для кожної версії не менше 0,05. Це вказує на те, що немає статистично значущої різниці в дисперсії тривалості перебування між чоловіками та жінками.
Примітка: Коновер, Джонсон і Джонсон (1981) рекомендують використовувати медіанний тест для спотворених даних, оскільки він, як правило, забезпечує більш точні результати. Для симетричних даних тест медіани та тест середнього значення дадуть подібні результати.