Як виконати односторонній дисперсійний аналіз у stata
Односторонній дисперсійний аналіз використовується для визначення того, чи існує статистично значуща різниця між середніми значеннями трьох або більше незалежних груп.
Цей тип тесту називається одностороннім дисперсійним аналізом, оскільки ми аналізуємо вплив змінної- прогнозу на змінну відповіді. Якби нас замість цього цікавив вплив двох змінних предикторів на змінну відповіді, ми могли б виконати двосторонній дисперсійний аналіз .
У цьому посібнику пояснюється, як виконати односторонній дисперсійний аналіз у Stata.
Приклад: односторонній дисперсійний аналіз у Stata
У цьому прикладі ми будемо використовувати вбудований набір даних Stata під назвою систолічний для виконання одностороннього дисперсійного аналізу. Цей набір даних містить такі три змінні для 58 різних осіб:
- Вживаний наркотик
- Хвороба пацієнта
- Зміна систолічного артеріального тиску
Ми використаємо наступні кроки, щоб виконати односторонній дисперсійний аналіз, щоб визначити, чи впливає тип використовуваного препарату на зміну систолічного артеріального тиску.
Крок 1. Завантажте дані.
Спочатку завантажте дані, ввівши webuse systolic у поле команди та натиснувши Enter.
Крок 2. Перегляньте необроблені дані.
Перш ніж виконувати односторонній дисперсійний аналіз, давайте спочатку подивимося на вихідні дані. У верхній панелі меню перейдіть до Дані > Редактор даних > Редактор даних (Огляд) . Це покаже нам фактичні дані для всіх 58 пацієнтів:
Крок 3: Візуалізуйте дані.
Далі візуалізуємо дані. Ми створимо коробкові діаграми для відображення розподілу значень систолічного артеріального тиску для кожної категорії ліків.
У верхній панелі меню перейдіть до Діаграми > Коробчатий графік . У змінних виберіть Систолічний:
Потім у підзаголовку «Категорії» під змінною «Групування» виберіть препарат:
Натисніть OK . Автоматично відобразиться діаграма з чотирма коробковими графіками:
Ми відразу бачимо, що розподіл змін систолічного артеріального тиску різниться в різних категоріях препаратів, але односторонній дисперсійний аналіз скаже нам, чи є ці відмінності статистично значущими.
Крок 4: Виконайте односторонній дисперсійний аналіз.
У верхній панелі меню перейдіть до Статистика > Лінійні та споріднені моделі > ANOVA/MANOVA > Односторонній ANOVA .
У розділі Response Variable виберіть Systolic. Під факторною змінною виберіть препарат. Потім клацніть прапорець біля пункту «Створити зведену таблицю» , щоб ми могли побачити базову описову статистику для кожної групи. Потім натисніть OK .
Буде відображено такий результат:
F-статистика становить 9,09 , а відповідне значення p — 0,0001 . Оскільки p-значення менше альфа = 0,05, ми можемо відхилити нульову гіпотезу про те, що середня зміна систолічного артеріального тиску для кожної групи однакова.
Іншими словами, існує статистично значуща різниця в середній зміні систолічного артеріального тиску принаймні між двома групами препаратів.
Крок 5. Виконайте кілька порівняльних тестів.
Тоді ми можемо виконати кілька порівняльних тестів, щоб фактично з’ясувати, які середні групи відрізняються одне від одного.
У верхній панелі меню перейдіть до Статистика > Підсумки, таблиці та тести > Підсумкова та описова статистика > Попарні порівняння середніх .
Для параметра «Змінна» виберіть змінну «Систолічний відгук». Для Over виберіть пояснювальну змінну drug . Для коригування для кількох порівнянь виберіть метод Тьюкі .
Потім у підзаголовку «Звітування» натисніть кнопку поруч із «Таблиці ефектів» і встановіть прапорець поруч із пунктом «Показати таблицю ефектів із довірчими інтервалами та значеннями p» . Потім натисніть OK .
Будуть відображені такі результати:
Кожен рядок являє собою порівняння між двома конкретними групами препаратів. Наприклад, у першому рядку порівнюється середня зміна систолічного артеріального тиску між групою препаратів 2 і групою препаратів 1. P-значення для цього порівняння становить 0,999 , що є надзвичайно високим і не менше 0,05. Це означає, що немає статистично значущої різниці між групами препаратів 1 і 2.
Однак ми бачимо, що p-значення для наступних порівнянь менше 0,05:
- ліки 3 до 1 | р-значення = 0,001
- медицина 4 до 1 | р-значення = 0,010
- медицина 3 проти 2 | р-значення = 0,001
- медицина 4 проти 2 | р-значення = 0,015
Це означає, що різниця в середній зміні систолічного артеріального тиску є статистично значущою між кожною з цих груп.
Крок 6: Повідомте про результати.
Нарешті, ми повідомимо результати нашого одностороннього аналізу ANOVA. Ось приклад того, як це зробити:
Було проведено односторонній дисперсійний аналіз, щоб визначити, чи чотири різні типи ліків мали різний вплив на систолічний артеріальний тиск.
У наступній таблиці підсумовано кількість учасників у кожній групі, а також середню зміну систолічного артеріального тиску та стандартне відхилення систолічного артеріального тиску для кожної групи:
Односторонній дисперсійний аналіз виявив наявність статистично значущої різниці принаймні між двома групами (F(3, 54) = 9,09, p = 0,001).
Тест Тьюкі для множинних порівнянь показав, що зміна систолічного артеріального тиску була статистично значно вищою для препарату 3, ніж для препарату 1 (17,32 +/- 4,15, p = 0,001), для препарату 3 порівняно з препаратом 2 (16,78 +/- 4,15, p = 0,001), для препарату 4 порівняно з препаратом 1 (12,57 +/- 3,85, p = 0,010), і для препарату 4 порівняно з препаратом 2 (12,03 +/- 3,85, p = 0,015).
Не було статистично значущої різниці між групами препаратів 1 і 2 (0,533 +/- 3,91, р = 0,999) або між групами препаратів 3 і 4 (4,75 +/- 4,09, р = 0,654).