Как использовать proc stdize в sas (с примером)
Стандартизация переменной означает масштабирование каждого значения переменной таким образом, чтобы среднее значение было равно 0, а стандартное отклонение равно 1.
Вы можете использовать следующую формулу для стандартизации переменной
(x i – x ) / с
Золото:
- x i : i-е значение набора данных
- x : Образец означает
- s : стандартное отклонение выборки
Самый простой способ стандартизировать переменную в SAS — использовать оператор PROC STDIZE .
Следующий пример показывает, как использовать это утверждение на практике.
Пример: Как использовать PROC STDIZE в SAS
Предположим, у нас есть следующий набор данных в SAS, содержащий информацию о различных баскетболистах:
/*create first dataset*/
data my_data;
input player $ points assists rebounds;
datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;
/*view dataset*/
proc print data =my_data;
Мы можем использовать оператор PROC STDIZE для создания нового набора данных, который стандартизирует каждую числовую переменную в наборе данных:
/*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;
/*view new dataset*/
proc print data =std_data;
Каждая из числовых переменных (очки, передачи, подборы) была стандартизирована и имела среднее значение 0 и стандартное отклонение 1.
Обратите внимание, что мы также можем использовать оператор VAR , чтобы указать, какие переменные нужно нормализовать.
Например, мы можем использовать следующий оператор PROC STDIZE с оператором VAR , чтобы нормализовать только переменную точек:
/*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
var points;
run ;
/*view new dataset*/
proc print data =std_data;
Значения в столбце «баллы» были стандартизированы, а все остальные столбцы остались нетронутыми.
Мы можем использовать оператор PROC MEANS , чтобы убедиться, что переменная точек теперь имеет среднее значение 0 и стандартное отклонение 1:
/*view mean and standard deviation of each variable*/ proc means data =std_data;
Мы видим, что переменная точек имеет среднее значение 0 и стандартное отклонение 1.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:
Как удалить строки с пропущенными значениями в SAS
Как рассчитать стандартное отклонение в SAS (3 примера)
Как рассчитать баллы Z в SAS