Як використовувати proc stdize у sas (з прикладом)


Стандартизація змінної означає масштабування кожного зі значень змінної таким чином, щоб середнє значення дорівнювало 0, а стандартне відхилення дорівнювало 1.

Ви можете використовувати наступну формулу для стандартизації змінної

(x ix ) / с

золото:

  • x i : i-те значення набору даних
  • x : вибірка означає
  • s : стандартне відхилення вибірки

Найпростішим способом стандартизації змінної в SAS є використання оператора PROC STDIZE .

У наступному прикладі показано, як використовувати цей оператор на практиці.

Приклад: як використовувати PROC STDIZE у SAS

Припустімо, що в SAS є такий набір даних, який містить інформацію про різних баскетболістів:

 /*create first dataset*/ 
data my_data;
    input player $ points assists rebounds;
    datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;

/*view dataset*/
proc print data =my_data;

Ми можемо використати оператор PROC STDIZE , щоб створити новий набір даних, який стандартизує кожну з числових змінних у наборі даних:

 /*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;

/*view new dataset*/
proc print data =std_data; 

Кожна з числових змінних (очки, передачі, підбирання) була стандартизована, щоб мати середнє значення 0 і стандартне відхилення 1.

Зверніть увагу, що ми також можемо використовувати оператор VAR , щоб вказати, які змінні нормалізувати.

Наприклад, ми можемо використати наступний оператор PROC STDIZE з оператором VAR , щоб нормалізувати лише змінну points:

 /*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
    var points;
run ;

/*view new dataset*/
proc print data =std_data; 

Значення в стовпці балів були стандартизовані, а всі інші стовпці залишилися незмінними.

Ми можемо використати оператор PROC MEANS , щоб переконатися, що змінна points тепер має середнє значення 0 і стандартне відхилення 1:

 /*view mean and standard deviation of each variable*/
proc means data =std_data; 

Ми бачимо, що змінна балів має середнє значення 0 і стандартне відхилення 1.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:

Як видалити рядки з відсутніми значеннями в SAS
Як обчислити стандартне відхилення в SAS (3 приклади)
Як розрахувати Z-бали в SAS

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *