Как использовать proc stdize в sas (с примером)


Стандартизация переменной означает масштабирование каждого значения переменной таким образом, чтобы среднее значение было равно 0, а стандартное отклонение равно 1.

Вы можете использовать следующую формулу для стандартизации переменной

(x ix ) / с

Золото:

  • x i : i-е значение набора данных
  • x : Образец означает
  • s : стандартное отклонение выборки

Самый простой способ стандартизировать переменную в SAS — использовать оператор PROC STDIZE .

Следующий пример показывает, как использовать это утверждение на практике.

Пример: Как использовать PROC STDIZE в SAS

Предположим, у нас есть следующий набор данных в SAS, содержащий информацию о различных баскетболистах:

 /*create first dataset*/ 
data my_data;
    input player $ points assists rebounds;
    datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;

/*view dataset*/
proc print data =my_data;

Мы можем использовать оператор PROC STDIZE для создания нового набора данных, который стандартизирует каждую числовую переменную в наборе данных:

 /*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;

/*view new dataset*/
proc print data =std_data; 

Каждая из числовых переменных (очки, передачи, подборы) была стандартизирована и имела среднее значение 0 и стандартное отклонение 1.

Обратите внимание, что мы также можем использовать оператор VAR , чтобы указать, какие переменные нужно нормализовать.

Например, мы можем использовать следующий оператор PROC STDIZE с оператором VAR , чтобы нормализовать только переменную точек:

 /*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
    var points;
run ;

/*view new dataset*/
proc print data =std_data; 

Значения в столбце «баллы» были стандартизированы, а все остальные столбцы остались нетронутыми.

Мы можем использовать оператор PROC MEANS , чтобы убедиться, что переменная точек теперь имеет среднее значение 0 и стандартное отклонение 1:

 /*view mean and standard deviation of each variable*/
proc means data =std_data; 

Мы видим, что переменная точек имеет среднее значение 0 и стандартное отклонение 1.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как удалить строки с пропущенными значениями в SAS
Как рассчитать стандартное отклонение в SAS (3 примера)
Как рассчитать баллы Z в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *