Sas でダミー変数を作成する方法 (例付き)


ダミー変数は、回帰分析で作成する変数の一種で、カテゴリカル変数を 0 または 1 の 2 つの値のいずれかを取る数値変数として表すことができます。

たとえば、次のデータセットがあり、年齢婚姻状況を使用して収入を予測したいとします。

婚姻状況を回帰モデルの予測変数として使用するには、それをダミー変数に変換する必要があります。

これは現在、3 つの異なる値 (「独身」、「既婚」、または「離婚」) を取ることができるカテゴリ変数であるため、 k -1 = 3-1 = 2 個のダミー変数を作成する必要があります。

このダミー変数を作成するには、最も頻繁に表示される「Single」を基本値としてそのままにしておきます。したがって、婚姻状況をダミー変数に変換する方法は次のとおりです。

次の例は、SAS でこの正確なデータセットのダミー変数を作成する方法を示しています。

例: SAS でのダミー変数の作成

まず、SAS で次のデータセットを作成しましょう。

 /*create dataset*/
data original_data;
    input income age status $;
    datalines ;
45 23 single
48 25 single
54 24 single
57 29 single
65 38 married
69 36 single
78 40 married
83 59 divorced
98 56 divorced
104 64 married
107 53 married
;
run ;

/*view dataset*/
proc print data = original_data; 

次に、2 つの IF-THEN-ELSE ステートメントを使用して、状態変数のダミー変数を作成できます。

 /*create new dataset with dummy variables*/
data new_data;
	set original_data;
	if status = " married " then married = 1 ;
	  else married = 0 ;
	if status = " divorced " then divorced = 1 ;
	  else divorced = 0 ;
run ;

/*view new dataset*/
proc print data =new_data;

SAS の例のダミー変数

2 つのダミー変数 (既婚離婚) の値が、導入例で計算した値と一致することに注意してください。

これらのダミー変数はどちらも数値であるため、必要に応じて回帰モデルで使用できます。

追加リソース

次のチュートリアルでは、SAS で他の一般的なタスクを実行する方法について説明します。

SAS での手順の概要の使用方法
SAS で Proc Tabulate を使用する方法
SAS で変数の名前を変更する方法
SAS で新しい変数を作成する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です