Як використовувати proc stdize у sas (з прикладом)
Стандартизація змінної означає масштабування кожного зі значень змінної таким чином, щоб середнє значення дорівнювало 0, а стандартне відхилення дорівнювало 1.
Ви можете використовувати наступну формулу для стандартизації змінної
(x i – x ) / с
золото:
- x i : i-те значення набору даних
- x : вибірка означає
- s : стандартне відхилення вибірки
Найпростішим способом стандартизації змінної в SAS є використання оператора PROC STDIZE .
У наступному прикладі показано, як використовувати цей оператор на практиці.
Приклад: як використовувати PROC STDIZE у SAS
Припустімо, що в SAS є такий набір даних, який містить інформацію про різних баскетболістів:
/*create first dataset*/
data my_data;
input player $ points assists rebounds;
datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;
/*view dataset*/
proc print data =my_data;
Ми можемо використати оператор PROC STDIZE , щоб створити новий набір даних, який стандартизує кожну з числових змінних у наборі даних:
/*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;
/*view new dataset*/
proc print data =std_data;
Кожна з числових змінних (очки, передачі, підбирання) була стандартизована, щоб мати середнє значення 0 і стандартне відхилення 1.
Зверніть увагу, що ми також можемо використовувати оператор VAR , щоб вказати, які змінні нормалізувати.
Наприклад, ми можемо використати наступний оператор PROC STDIZE з оператором VAR , щоб нормалізувати лише змінну points:
/*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
var points;
run ;
/*view new dataset*/
proc print data =std_data;
Значення в стовпці балів були стандартизовані, а всі інші стовпці залишилися незмінними.
Ми можемо використати оператор PROC MEANS , щоб переконатися, що змінна points тепер має середнє значення 0 і стандартне відхилення 1:
/*view mean and standard deviation of each variable*/ proc means data =std_data;
Ми бачимо, що змінна балів має середнє значення 0 і стандартне відхилення 1.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в SAS:
Як видалити рядки з відсутніми значеннями в SAS
Як обчислити стандартне відхилення в SAS (3 приклади)
Як розрахувати Z-бали в SAS