Sas에서 더미 변수를 생성하는 방법(예 포함)


더미 변수는 범주형 변수를 0 또는 1의 두 값 중 하나를 취하는 숫자 변수로 나타낼 수 있도록 회귀 분석에서 생성하는 변수 유형입니다.

예를 들어, 다음과 같은 데이터 세트가 있고 나이결혼 상태를 사용하여 소득을 예측한다고 가정해 보겠습니다.

회귀 모델에서 결혼 상태를 예측 변수로 사용하려면 이를 더미 변수로 변환해야 합니다.

이는 현재 세 가지 다른 값(“미혼”, “기혼” 또는 “이혼”)을 취할 수 있는 범주형 변수이므로 k -1 = 3-1 = 2개의 더미 변수를 만들어야 합니다.

이 더미 변수를 생성하려면 가장 자주 나타나는 “Single”을 기본 값으로 남겨 둘 수 있습니다. 따라서 결혼 상태를 더미 변수로 변환하는 방법은 다음과 같습니다.

다음 예에서는 SAS에서 이 정확한 데이터 세트에 대한 더미 변수를 생성하는 방법을 보여줍니다.

예: SAS에서 더미 변수 생성

먼저 SAS에서 다음 데이터 세트를 생성해 보겠습니다.

 /*create dataset*/
data original_data;
    input income age status $;
    datalines ;
45 23 single
48 25 single
54 24 single
57 29 single
65 38 married
69 36 single
78 40 married
83 59 divorced
98 56 divorced
104 64 married
107 53 married
;
run ;

/*view dataset*/
proc print data = original_data; 

다음으로 두 개의 IF-THEN-ELSE 문을 사용하여 상태 변수에 대한 더미 변수를 만들 수 있습니다.

 /*create new dataset with dummy variables*/
data new_data;
	set original_data;
	if status = " married " then married = 1 ;
	  else married = 0 ;
	if status = " divorced " then divorced = 1 ;
	  else divorced = 0 ;
run ;

/*view new dataset*/
proc print data =new_data;

SAS 예제의 더미 변수

두 개의 더미 변수( 결혼이혼 )의 값은 소개 예에서 계산한 값과 일치합니다.

그런 다음 원하는 경우 회귀 모델 에서 이러한 더미 변수를 사용할 수 있습니다. 둘 다 숫자이기 때문입니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 절차 요약을 사용하는 방법
SAS에서 Proc Tabulate를 사용하는 방법
SAS에서 변수 이름을 바꾸는 방법
SAS에서 새 변수를 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다