Sas: como usar instruções keep e drop
Você pode usar instruções KEEP e DROP no SAS ao criar um novo conjunto de dados para manter ou remover variáveis específicas de um conjunto de dados existente.
Estas instruções usam a seguinte sintaxe básica:
Método 1: Escolha quais colunas MANTER
data new_data;
set original_data;
keep var1 var3;
run ;
Método 2: escolha quais colunas excluir
data new_data;
set original_data;
dropvar5 ;
run ;
Os exemplos a seguir mostram como usar cada método com o seguinte conjunto de dados no SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;
/*view dataset*/
proc print data = original_data;
Exemplo 1: Escolha as colunas para KEEP
O código a seguir demonstra como criar um novo conjunto de dados no SAS usando a instrução KEEP para reter apenas as variáveis shift e bounce do conjunto de dados original:
/*create new dataset*/
data new_data;
set original_data;
keep team rebounds;
run ;
/*view new dataset*/
proc print data = new_data;
Observe que mantivemos as variáveis team e rebound do conjunto de dados original e todas as outras variáveis foram simplesmente removidas.
Exemplo 2: Escolha as colunas a serem excluídas
O código a seguir mostra como criar um novo conjunto de dados no SAS usando a instrução DROP para remover a variável bounces do conjunto de dados original:
/*create new dataset*/
data new_data;
set original_data;
drop rebounds;
run ;
/*view new dataset*/
proc print data = new_data;
Observe que a variável bounces foi removida do conjunto de dados enquanto todas as outras variáveis do conjunto de dados original foram mantidas.
MANTER vs. DROP: Qual declaração você deve usar?
As instruções KEEP e DROP alcançam o mesmo resultado: ambas permitem criar um novo conjunto de dados mantendo ou removendo certas variáveis de um conjunto de dados existente.
Normalmente, usamos a instrução KEEP quando queremos manter apenas algumas variáveis do conjunto de dados original, porque isso é mais rápido do que inserir todas as variáveis que queremos remover.
Alternativamente, normalmente usamos a instrução DROP quando queremos remover apenas algumas variáveis do conjunto de dados original, porque isso é mais rápido do que inserir todas as variáveis que queremos manter.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como renomear variáveis no SAS
Como criar novas variáveis no SAS
Como substituir caracteres em uma string no SAS