Sas: як використовувати proc univariate для тестування нормальності


Ви можете використовувати proc univariate у SAS із оператором normal для виконання кількох перевірок нормальності для змінної в наборі даних.

Ця процедура використовує такий базовий синтаксис:

 proc univariate data =my_data normal ;
    var my_variable;
run ;

У наступному прикладі показано, як використовувати цю процедуру на практиці.

Приклад: Proc Univariate для перевірки нормальності в SAS

Припустімо, що в SAS є такий набір даних, який містить інформацію про різних баскетболістів:

 /*create dataset*/
data my_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data =my_data;

Ми можемо використовувати proc univariate з оператором normal для виконання різноманітних тестів нормальності для змінної points :

 proc univariate data =my_data normal ;
    var points;
run ;

Кілька таблиць буде відображено в результаті, але таблиця під назвою Тести нормальності містить результати тестів нормальності:

SAS proc однофакторний тест нормальності

За замовчуванням SAS виконує чотири перевірки нормальності та відображає статистику кожного тесту та відповідні значення p:

  • Тест Шапіро-Вілка : W = 0,867, p = 0,0383
  • Тест Колмогорова-Смирнова : D = 0,237, p = 0,0318
  • Тест Крамера-фон Мізеса : W-Sq = 0,152, p = 0,0200
  • Тест Андерсона-Дарлінга : A-Sq = 0,847, p = 0,0223

Кожен тест нормальності використовує такі нульові та альтернативні гіпотези:

  • H 0 : Дані розподіляються нормально.
  • H A : дані не розподіляються нормально.

Оскільки p-значення для кожного тесту нормальності менше 0,05, ми б відхилили нульову гіпотезу для кожного тесту нормальності.

Це означає, що є достатньо доказів, щоб зробити висновок про те, що змінна балів не розподілена нормально.

Зверніть увагу, що ви також можете створити гістограму з накладеною нормальною кривою, щоб візуалізувати розподіл значень змінної точки :

 proc univariate data =my_data;
    histogram points / normal ;
run ; 

Гістограма показує, що розподіл значень не дуже добре відповідає нормальній кривій, що узгоджується з результатами тестів нормальності, які ми провели.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як використовувати зведення процедур у SAS
Як використовувати Proc Tabulate у SAS
Як використовувати зіставлення Proc у SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *