Как выполнить тест крускала-уоллиса в sas


Тест Крускала-Уоллиса используется для определения наличия или отсутствия статистически значимой разницы между медианами трех или более независимых групп.

Он считается непараметрическим эквивалентом однофакторного дисперсионного анализа .

В этом руководстве представлен пошаговый пример выполнения теста Крускала-Уоллиса в SAS.

Шаг 1: Введите данные

Предположим, исследователи хотят знать, приводят ли три разных удобрения к разным уровням роста растений.

Они случайным образом выбирают 30 разных растений и делят их на три группы по 10, применяя к каждой группе разные удобрения. Через месяц измеряют высоту каждого растения.

Мы введем в SAS следующие данные, которые показывают общий рост (в дюймах) каждого из 10 растений в каждой группе:

 /*create dataset*/
data fertilizer_data;
    input fertilizer $growth;
    datalines ;
fert1 7
fert1 14
fert1 14
fert1 13
fert1 12
fert1 9
fert1 6
fert1 14
fert1 12
fert1 8
fert2 15
fert2 17
fert2 13
fert2 15
fert2 15
fert2 13
fert2 9
fert2 12
fert2 10
fert2 8
fert3 6
fert3 8
fert3 8
fert3 9
fert3 5
fert3 14
fert3 13
fert3 8
fert3 10
fert3 9
;
run ;

Шаг 2. Выполните тест Краскела-Уоллиса.

Далее мы воспользуемся оператором proc npar1way , чтобы выполнить тест Крускала-Уоллиса и сравнить средний рост растений между тремя группами удобрений:

 /*perform Kruskal-Wallis test*/
proc npar1way data =fertilizer_data wilcoxon dscf ;
    class fertilizer;
    vargrowth ;
run ;

Шаг 3: Интерпретируйте результаты

Первая таблица результатов показывает общую статистику теста Хи-квадрат и соответствующее значение p для теста Крускала-Уоллиса:

P-значение теста составляет 0,0431 . Поскольку это значение меньше 0,05, мы отвергаем нулевую гипотезу о том, что средний рост растений одинаков для всех трех удобрений.

Это означает, что у нас есть достаточно доказательств, чтобы сделать вывод, что тип используемого удобрения вызывает статистически значимые различия в росте растений.

В итоговой таблице результатов показаны значения p для парных сравнений между каждой из трех групп:

Из этой таблицы мы видим, что единственное значение p ниже 0,05 — это сравнение между удобрением 2 и удобрением 3, значение p которого равно 0,0390 .

Это означает, что существует статистически значимая разница в росте растений между удобрением 2 и удобрением 3, но не между другими парными сравнениями.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные статистические тесты в SAS:

Как выполнить одновыборочный t-тест в SAS
Как выполнить t-тест с двумя выборками в SAS
Как выполнить односторонний дисперсионный анализ в SAS
Как выполнить двусторонний дисперсионный анализ в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *