Como subconjunto de dados em sas (3 exemplos)
Aqui estão as três maneiras mais comuns de criar subconjuntos de um conjunto de dados no SAS:
Método 1: escolha quais colunas manter
data new_data;
set original_data;
keep var1 var3;
run ;
Método 2: escolha quais colunas excluir
data new_data;
set original_data;
dropvar4 ;
run ;
Método 3: escolha quais linhas manter com base na condição
data new_data;
set original_data;
if var1 < 25 then delete;
run ;
Os exemplos a seguir mostram como usar cada método com o seguinte conjunto de dados no SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;
/*view dataset*/
proc print data = original_data;
Exemplo 1: Escolha quais colunas manter
O código a seguir mostra como criar subconjuntos de um conjunto de dados usando a instrução KEEP para manter apenas determinadas colunas:
/*create new dataset*/
data new_data;
set original_data;
keep team points;
run ;
/*view new dataset*/
proc print data = new_data;
Exemplo 2: Escolha as colunas a serem excluídas
O código a seguir mostra como criar subconjuntos de um conjunto de dados usando a instrução DROP para eliminar colunas específicas:
/*create new dataset*/
data new_data;
set original_data;
drop points;
run ;
/*view new dataset*/
proc print data = new_data;
Exemplo 3: Escolha quais linhas manter com base na condição
O código a seguir mostra como criar um subconjunto de um conjunto de dados usando a instrução DELETE para excluir linhas específicas do conjunto de dados cujo valor na coluna de pontos é menor que 25:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Você também pode usar o OR “ | ”para remover linhas onde os pontos são inferiores a 25 ou os rebotes são inferiores a 10:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 | rebounds < 10 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Você também pode usar o operador AND ” & ” para remover linhas onde os pontos são menores que 25 e os saltos são menores que 10:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 & rebounds < 10 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como renomear variáveis no SAS
Como criar novas variáveis no SAS
Como substituir caracteres em uma string no SAS