Sas에서 데이터를 정규화하는 방법


데이터 값 집합을 “정규화”한다는 것은 모든 값의 평균이 0이고 표준 편차가 1이 되도록 값의 크기를 조정하는 것을 의미합니다.

이 튜토리얼에서는 SAS에서 데이터를 정규화하는 방법을 설명합니다.

예: SAS에서 데이터를 정규화하는 방법

다음과 같은 데이터 세트가 있다고 가정합니다.

SAS에서 이 데이터 값 세트를 정규화하려면 다음 단계를 완료하세요.

1단계: 데이터세트 만들기

먼저 다음 코드를 사용하여 SAS에서 데이터 세트를 생성해 보겠습니다.

 /*create dataset*/
data original_data;
    input values;
    datalines ;
12
14
15
15
16
17
18
20
24
25
26
29
32
34
37
;
run ;

/*view mean and standard deviation of dataset*/
proc means data =original_data Mean StdDev ndec= 3 ; 
   var values;
run ; 

결과에서 데이터 세트의 평균은 22.267 이고 표준 편차는 7.968 임을 알 수 있습니다.

2단계: 데이터세트 정규화

다음으로 proc stdize를 사용하여 데이터 세트를 정규화합니다.

 /*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
   var values;
run ;

/*print normalized dataset*/
proc print data =normalized_data;
 
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ; 
   var values;
run ; 

결과에서 정규화된 데이터 세트의 평균은 0 이고 표준 편차는 1 임을 알 수 있습니다.

3단계: 정규화된 데이터 해석

SAS는 다음 공식을 사용하여 데이터 값을 정규화했습니다.

정규화된 값 = (x – x ) / s

금:

  • x = 데이터 값
  • x = 데이터 세트의 평균
  • s = 데이터 세트의 표준 편차

각 정규화된 값은 원래 데이터 값과 평균 사이의 표준 편차 수를 알려줍니다.

예를 들어 원본 데이터 세트의 데이터 포인트 “12”를 고려해보세요. 원래 표본 평균은 22.267이었고 원래 표본 표준 편차는 7.968이었습니다.

“12”에 대한 정규화된 값은 다음과 같이 계산하여 -1.288로 나타났습니다.

정규화된 값 = (x – x ) / s = (12 – 22.267) / 7.968 = -1.288

이는 값 “12”가 원래 데이터세트의 평균보다 1.288 표준편차 낮다는 것을 의미합니다.

데이터 세트의 각 정규화된 값은 특정 데이터 값이 평균과 얼마나 가깝거나 먼지를 이해하는 데 도움이 될 수 있습니다.

정규화된 값이 작다는 것은 값이 평균에 가깝다는 것을 나타내고, 정규화된 값이 크다는 것은 값이 평균에서 멀다는 것을 의미합니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 절차 요약을 사용하는 방법
SAS에서 상관관계를 계산하는 방법
SAS에서 빈도표를 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다