Sas でダミー変数を作成する方法 (例付き)
ダミー変数は、回帰分析で作成する変数の一種で、カテゴリカル変数を 0 または 1 の 2 つの値のいずれかを取る数値変数として表すことができます。
たとえば、次のデータセットがあり、年齢と婚姻状況を使用して収入を予測したいとします。
婚姻状況を回帰モデルの予測変数として使用するには、それをダミー変数に変換する必要があります。
これは現在、3 つの異なる値 (「独身」、「既婚」、または「離婚」) を取ることができるカテゴリ変数であるため、 k -1 = 3-1 = 2 個のダミー変数を作成する必要があります。
このダミー変数を作成するには、最も頻繁に表示される「Single」を基本値としてそのままにしておきます。したがって、婚姻状況をダミー変数に変換する方法は次のとおりです。
次の例は、SAS でこの正確なデータセットのダミー変数を作成する方法を示しています。
例: SAS でのダミー変数の作成
まず、SAS で次のデータセットを作成しましょう。
/*create dataset*/ data original_data; input income age status $; datalines ; 45 23 single 48 25 single 54 24 single 57 29 single 65 38 married 69 36 single 78 40 married 83 59 divorced 98 56 divorced 104 64 married 107 53 married ; run ; /*view dataset*/ proc print data = original_data;
次に、2 つの IF-THEN-ELSE ステートメントを使用して、状態変数のダミー変数を作成できます。
/*create new dataset with dummy variables*/
data new_data;
set original_data;
if status = " married " then married = 1 ;
else married = 0 ;
if status = " divorced " then divorced = 1 ;
else divorced = 0 ;
run ;
/*view new dataset*/
proc print data =new_data;
2 つのダミー変数 (既婚と離婚) の値が、導入例で計算した値と一致することに注意してください。
これらのダミー変数はどちらも数値であるため、必要に応じて回帰モデルで使用できます。
追加リソース
次のチュートリアルでは、SAS で他の一般的なタスクを実行する方法について説明します。
SAS での手順の概要の使用方法
SAS で Proc Tabulate を使用する方法
SAS で変数の名前を変更する方法
SAS で新しい変数を作成する方法