Як виконати односторонній дисперсійний аналіз у stata


Односторонній дисперсійний аналіз використовується для визначення того, чи існує статистично значуща різниця між середніми значеннями трьох або більше незалежних груп.

Цей тип тесту називається одностороннім дисперсійним аналізом, оскільки ми аналізуємо вплив змінної- прогнозу на змінну відповіді. Якби нас замість цього цікавив вплив двох змінних предикторів на змінну відповіді, ми могли б виконати двосторонній дисперсійний аналіз .

У цьому посібнику пояснюється, як виконати односторонній дисперсійний аналіз у Stata.

Приклад: односторонній дисперсійний аналіз у Stata

У цьому прикладі ми будемо використовувати вбудований набір даних Stata під назвою систолічний для виконання одностороннього дисперсійного аналізу. Цей набір даних містить такі три змінні для 58 різних осіб:

  • Вживаний наркотик
  • Хвороба пацієнта
  • Зміна систолічного артеріального тиску

Ми використаємо наступні кроки, щоб виконати односторонній дисперсійний аналіз, щоб визначити, чи впливає тип використовуваного препарату на зміну систолічного артеріального тиску.

Крок 1. Завантажте дані.

Спочатку завантажте дані, ввівши webuse systolic у поле команди та натиснувши Enter.

Приклад завантаження даних у Stata

Крок 2. Перегляньте необроблені дані.

Перш ніж виконувати односторонній дисперсійний аналіз, давайте спочатку подивимося на вихідні дані. У верхній панелі меню перейдіть до Дані > Редактор даних > Редактор даних (Огляд) . Це покаже нам фактичні дані для всіх 58 пацієнтів:

Приклад одностороннього дисперсійного аналізу в Stata

Крок 3: Візуалізуйте дані.

Далі візуалізуємо дані. Ми створимо коробкові діаграми для відображення розподілу значень систолічного артеріального тиску для кожної категорії ліків.

У верхній панелі меню перейдіть до Діаграми > Коробчатий графік . У змінних виберіть Систолічний:

Boxplot у Статі

Потім у підзаголовку «Категорії» під змінною «Групування» виберіть препарат:

Приклад коробкового графіка в Stata

Натисніть OK . Автоматично відобразиться діаграма з чотирма коробковими графіками:

Кілька блоків у Stata

Ми відразу бачимо, що розподіл змін систолічного артеріального тиску різниться в різних категоріях препаратів, але односторонній дисперсійний аналіз скаже нам, чи є ці відмінності статистично значущими.

Крок 4: Виконайте односторонній дисперсійний аналіз.

У верхній панелі меню перейдіть до Статистика > Лінійні та споріднені моделі > ANOVA/MANOVA > Односторонній ANOVA .

У розділі Response Variable виберіть Systolic. Під факторною змінною виберіть препарат. Потім клацніть прапорець біля пункту «Створити зведену таблицю» , щоб ми могли побачити базову описову статистику для кожної групи. Потім натисніть OK .

Приклад одностороннього дисперсійного аналізу в Stata

Буде відображено такий результат:

Односторонній дисперсійний аналіз у Stata

F-статистика становить 9,09 , а відповідне значення p — 0,0001 . Оскільки p-значення менше альфа = 0,05, ми можемо відхилити нульову гіпотезу про те, що середня зміна систолічного артеріального тиску для кожної групи однакова.

Іншими словами, існує статистично значуща різниця в середній зміні систолічного артеріального тиску принаймні між двома групами препаратів.

Крок 5. Виконайте кілька порівняльних тестів.

Тоді ми можемо виконати кілька порівняльних тестів, щоб фактично з’ясувати, які середні групи відрізняються одне від одного.

У верхній панелі меню перейдіть до Статистика > Підсумки, таблиці та тести > Підсумкова та описова статистика > Попарні порівняння середніх .

Для параметра «Змінна» виберіть змінну «Систолічний відгук». Для Over виберіть пояснювальну змінну drug . Для коригування для кількох порівнянь виберіть метод Тьюкі .

Кілька порівнянь для одностороннього дисперсійного аналізу в Stata

Потім у підзаголовку «Звітування» натисніть кнопку поруч із «Таблиці ефектів» і встановіть прапорець поруч із пунктом «Показати таблицю ефектів із довірчими інтервалами та значеннями p» . Потім натисніть OK .

Кілька порівнянь у Stata

Будуть відображені такі результати:

Тест Tukey у результатах Stata

Кожен рядок являє собою порівняння між двома конкретними групами препаратів. Наприклад, у першому рядку порівнюється середня зміна систолічного артеріального тиску між групою препаратів 2 і групою препаратів 1. P-значення для цього порівняння становить 0,999 , що є надзвичайно високим і не менше 0,05. Це означає, що немає статистично значущої різниці між групами препаратів 1 і 2.

Однак ми бачимо, що p-значення для наступних порівнянь менше 0,05:

  • ліки 3 до 1 | р-значення = 0,001
  • медицина 4 до 1 | р-значення = 0,010
  • медицина 3 проти 2 | р-значення = 0,001
  • медицина 4 проти 2 | р-значення = 0,015

Це означає, що різниця в середній зміні систолічного артеріального тиску є статистично значущою між кожною з цих груп.

Крок 6: Повідомте про результати.

Нарешті, ми повідомимо результати нашого одностороннього аналізу ANOVA. Ось приклад того, як це зробити:


Було проведено односторонній дисперсійний аналіз, щоб визначити, чи чотири різні типи ліків мали різний вплив на систолічний артеріальний тиск.

У наступній таблиці підсумовано кількість учасників у кожній групі, а також середню зміну систолічного артеріального тиску та стандартне відхилення систолічного артеріального тиску для кожної групи:

Описова статистика для одностороннього дисперсійного аналізу в Stata

Односторонній дисперсійний аналіз виявив наявність статистично значущої різниці принаймні між двома групами (F(3, 54) = 9,09, p = 0,001).

Тест Тьюкі для множинних порівнянь показав, що зміна систолічного артеріального тиску була статистично значно вищою для препарату 3, ніж для препарату 1 (17,32 +/- 4,15, p = 0,001), для препарату 3 порівняно з препаратом 2 (16,78 +/- 4,15, p = 0,001), для препарату 4 порівняно з препаратом 1 (12,57 +/- 3,85, p = 0,010), і для препарату 4 порівняно з препаратом 2 (12,03 +/- 3,85, p = 0,015).

Не було статистично значущої різниці між групами препаратів 1 і 2 (0,533 +/- 3,91, р = 0,999) або між групами препаратів 3 і 4 (4,75 +/- 4,09, р = 0,654).

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *