Como criar variáveis fictícias em sas (com exemplo)
Uma variável fictícia é um tipo de variável que criamos na análise de regressão para que possamos representar uma variável categórica como uma variável numérica que assume um de dois valores: zero ou um.
Por exemplo, suponha que temos o seguinte conjunto de dados e queremos usar a idade e o estado civil para prever a renda :
Para usar o estado civil como variável preditora em um modelo de regressão, precisamos convertê-lo em uma variável dummy.
Como esta é atualmente uma variável categórica que pode assumir três valores diferentes (“Solteiro”, “Casado” ou “Divorciado”), precisamos criar k -1 = 3-1 = 2 variáveis fictícias.
Para criar esta variável fictícia, podemos deixar “Single” como valor base, pois ele aparece com mais frequência. Então, aqui está como converteríamos o estado civil em variáveis fictícias:
O exemplo a seguir mostra como criar variáveis fictícias para este conjunto de dados exato no SAS.
Exemplo: Criando Variáveis Dummy em SAS
Primeiro, vamos criar o seguinte conjunto de dados no SAS:
/*create dataset*/ data original_data; input income age status $; datalines ; 45 23 single 48 25 single 54 24 single 57 29 single 65 38 married 69 36 single 78 40 married 83 59 divorced 98 56 divorced 104 64 married 107 53 married ; run ; /*view dataset*/ proc print data = original_data;
A seguir, podemos usar duas instruções IF-THEN-ELSE para criar variáveis fictícias para a variável de estado :
/*create new dataset with dummy variables*/
data new_data;
set original_data;
if status = " married " then married = 1 ;
else married = 0 ;
if status = " divorced " then divorced = 1 ;
else divorced = 0 ;
run ;
/*view new dataset*/
proc print data =new_data;
Observe que os valores das duas variáveis dummies ( casado e divorciado ) correspondem aos valores que calculamos no exemplo introdutório.
Poderíamos então usar essas variáveis fictícias em um modelo de regressão , se quiséssemos, já que ambas são numéricas.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como usar o resumo do procedimento no SAS
Como usar o Proc Tabulate no SAS
Como renomear variáveis no SAS
Como criar novas variáveis no SAS