Як використовувати оператор lsmeans у sas (з прикладом)
Односторонній дисперсійний аналіз використовується для визначення того, чи існує статистично значуща різниця між середніми значеннями трьох або більше незалежних груп.
Якщо загальне p-значення таблиці ANOVA нижче певного рівня значущості, то ми маємо достатньо доказів, щоб стверджувати, що принаймні одне з групових середніх відрізняється від інших.
Щоб точно з’ясувати, які групові середні відрізняються, нам потрібно виконати постгок тест .
Ви можете використовувати оператор LSMEANS у SAS для виконання різноманітних пост-хок тестів.
У наступному прикладі показано, як використовувати оператор LSMEANS на практиці.
Приклад: як використовувати оператор LSMEANS у SAS
Припустімо, що дослідник набирає 30 студентів для участі в дослідженні. Для підготовки до іспиту студенти випадковим чином розподіляються для використання одного з трьох методів навчання.
Результати іспитів для кожного студента наведено нижче:
Ми можемо використати такий код, щоб створити цей набір даних у SAS:
/*create dataset*/
data my_data;
input Method $Score;
datalines ;
At 78
At 81
At 82
At 82
At 85
At 88
At 88
At 90
B 81
B 83
B 83
B85
B 86
B 88
B90
B91
C 84
C 88
C 88
C 89
C 90
C 93
C 95
C 98
;
run ;
Далі ми використаємо proc ANOVA для виконання одностороннього ANOVA:
/*perform one-way ANOVA*/
proc ANOVA data =my_data;
classMethod ;
modelScore = Method;
run ;
Це створює таку таблицю ANOVA:
З цієї таблиці ми бачимо:
- Загальне F-значення: 5,26
- Відповідне p-значення: 0,0140
Нагадаємо, що односторонній дисперсійний аналіз використовує такі нульові та альтернативні гіпотези:
- H 0 : Усі групові середні рівні.
- H A : Принаймні одна середня група відрізняється відпочинок.
Оскільки p-значення таблиці ANOVA ( 0,0140 ) менше α = 0,05, ми відхиляємо нульову гіпотезу.
Це говорить нам про те, що середня оцінка іспиту не однакова для трьох методів навчання.
Щоб точно визначити, які середні групи відрізняються, ми можемо використати інструкцію PROC GLIMMIX з інструкцією LSMEANS і параметром ADJUST=TUKEY для виконання пост-хок тестів Tukey:
/*perform Tukey post-hoc comparisons*/
proc glimmix data =my_data;
classMethod ;
modelScore = Method;
lsmeans Method / adjust =tukey alpha = .05 ;
run ;
Остання таблиця результатів показує результати аналітичних порівнянь Tukey:
Ми можемо переглянути стовпець Adj P , щоб переглянути p-значення, скориговані на різницю середніх значень групи.
У цьому стовпці ми бачимо, що є лише один рядок зі скоригованим p-значенням менше 0,05: рядок, у якому порівнюється середня різниця між групою A та групою C.
Це говорить нам про те, що існує статистично значуща різниця в середніх балах за іспит між групою A та групою C.
Конкретно ми бачимо:
- Різниця між середніми екзаменаційними балами студентів групи А та студентів групи Б становила – 6,375 . (тобто студенти групи А мали середній бал на іспиті на 6,375 балів нижчий, ніж студенти групи С)
- Скоригований p-значення для різниці середніх становить 0,0137 .
- Скоригований 95% довірчий інтервал для справжньої різниці середніх балів за іспит між цими двома групами становить [-11,5219, -1,2281] .
Статистично значущих відмінностей між середніми показниками інших груп немає.
Примітка : у цьому прикладі ми використовували ADJUST=TUKEY для виконання пост-гок порівнянь Tukey, але ви також можете вказати BON , BUNNET , NELSON , SCHEFFE , SIDAK і SMM для виконання інших типів пост-хок порівнянь.
По темі: Тьюкі проти Бонферроні проти Шеффе: який тест використовувати?
Додаткові ресурси
У наступних посібниках надається додаткова інформація про моделі ANOVA:
Посібник із використання пост-хок тестування з ANOVA
Як виконати односторонній дисперсійний аналіз у SAS
Як виконати двосторонній дисперсійний аналіз у SAS