Sas: як використовувати proc univariate для тестування нормальності
Ви можете використовувати proc univariate у SAS із оператором normal для виконання кількох перевірок нормальності для змінної в наборі даних.
Ця процедура використовує такий базовий синтаксис:
proc univariate data =my_data normal ;
var my_variable;
run ;
У наступному прикладі показано, як використовувати цю процедуру на практиці.
Приклад: Proc Univariate для перевірки нормальності в SAS
Припустімо, що в SAS є такий набір даних, який містить інформацію про різних баскетболістів:
/*create dataset*/
data my_data;
input team $pointsrebounds;
datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;
/*view dataset*/
proc print data =my_data;
Ми можемо використовувати proc univariate з оператором normal для виконання різноманітних тестів нормальності для змінної points :
proc univariate data =my_data normal ;
var points;
run ;
Кілька таблиць буде відображено в результаті, але таблиця під назвою Тести нормальності містить результати тестів нормальності:
За замовчуванням SAS виконує чотири перевірки нормальності та відображає статистику кожного тесту та відповідні значення p:
- Тест Шапіро-Вілка : W = 0,867, p = 0,0383
- Тест Колмогорова-Смирнова : D = 0,237, p = 0,0318
- Тест Крамера-фон Мізеса : W-Sq = 0,152, p = 0,0200
- Тест Андерсона-Дарлінга : A-Sq = 0,847, p = 0,0223
Кожен тест нормальності використовує такі нульові та альтернативні гіпотези:
- H 0 : Дані розподіляються нормально.
- H A : дані не розподіляються нормально.
Оскільки p-значення для кожного тесту нормальності менше 0,05, ми б відхилили нульову гіпотезу для кожного тесту нормальності.
Це означає, що є достатньо доказів, щоб зробити висновок про те, що змінна балів не розподілена нормально.
Зверніть увагу, що ви також можете створити гістограму з накладеною нормальною кривою, щоб візуалізувати розподіл значень змінної точки :
proc univariate data =my_data;
histogram points / normal ;
run ;
Гістограма показує, що розподіл значень не дуже добре відповідає нормальній кривій, що узгоджується з результатами тестів нормальності, які ми провели.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як використовувати зведення процедур у SAS
Як використовувати Proc Tabulate у SAS
Як використовувати зіставлення Proc у SAS