Sas에서 proc stdize를 사용하는 방법(예제 포함)


변수를 표준화한다는 것은 평균값이 0, 표준편차가 1이 되도록 각 변수의 값을 조정하는 것을 의미합니다.

다음 공식을 사용하여 변수를 표준화할 수 있습니다.

( xix ) / 초

금:

  • x i : 데이터세트의 i번째
  • x : 표본의 의미
  • s : 표본의 표준편차

SAS에서 변수를 표준화하는 가장 쉬운 방법은 PROC STDIZE 문을 사용하는 것입니다.

다음 예에서는 이 문을 실제로 사용하는 방법을 보여줍니다.

예: SAS에서 PROC STDIZE를 사용하는 방법

SAS에 다양한 농구 선수에 대한 정보가 포함된 다음과 같은 데이터 세트가 있다고 가정합니다.

 /*create first dataset*/ 
data my_data;
    input player $ points assists rebounds;
    datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;

/*view dataset*/
proc print data =my_data;

PROC STDIZE 문을 사용하여 데이터세트의 각 숫자 변수를 표준화하는 새 데이터세트를 만들 수 있습니다.

 /*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;

/*view new dataset*/
proc print data =std_data; 

각 수치변수(득점, 어시스트, 리바운드)는 평균이 0, 표준편차가 1로 표준화되었습니다.

VAR 문을 사용하여 정규화할 변수를 지정할 수도 있습니다.

예를 들어, 다음 PROC STDIZE 문을 VAR 문과 함께 사용하여 포인트 변수만 정규화할 수 있습니다.

 /*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
    var points;
run ;

/*view new dataset*/
proc print data =std_data; 

포인트 열의 값은 표준화되었으며 다른 모든 열은 그대로 유지되었습니다.

PROC MEANS 문을 사용하여 points 변수의 평균값이 0이고 표준편차가 1인지 확인할 수 있습니다.

 /*view mean and standard deviation of each variable*/
proc means data =std_data; 

points 변수의 평균값은 0이고 표준편차는 1입니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 누락된 값이 있는 행을 삭제하는 방법
SAS에서 표준 편차를 계산하는 방법(3가지 예)
SAS에서 Z 점수를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다