Sas: como usar instruções keep e drop


Você pode usar instruções KEEP e DROP no SAS ao criar um novo conjunto de dados para manter ou remover variáveis específicas de um conjunto de dados existente.

Estas instruções usam a seguinte sintaxe básica:

Método 1: Escolha quais colunas MANTER

 data new_data;
    set original_data;
    keep var1 var3;
run ;

Método 2: escolha quais colunas excluir

 data new_data;
    set original_data;
    dropvar5 ;
run ;

Os exemplos a seguir mostram como usar cada método com o seguinte conjunto de dados no SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;

/*view dataset*/
proc print data = original_data; 

Exemplo 1: Escolha as colunas para KEEP

O código a seguir demonstra como criar um novo conjunto de dados no SAS usando a instrução KEEP para reter apenas as variáveis shift e bounce do conjunto de dados original:

 /*create new dataset*/
data new_data;
    set original_data;
    keep team rebounds;
run ;

/*view new dataset*/
proc print data = new_data;

Observe que mantivemos as variáveis team e rebound do conjunto de dados original e todas as outras variáveis foram simplesmente removidas.

Exemplo 2: Escolha as colunas a serem excluídas

O código a seguir mostra como criar um novo conjunto de dados no SAS usando a instrução DROP para remover a variável bounces do conjunto de dados original:

 /*create new dataset*/
data new_data;
    set original_data;
    drop rebounds;
run ;

/*view new dataset*/
proc print data = new_data;

Observe que a variável bounces foi removida do conjunto de dados enquanto todas as outras variáveis do conjunto de dados original foram mantidas.

MANTER vs. DROP: Qual declaração você deve usar?

As instruções KEEP e DROP alcançam o mesmo resultado: ambas permitem criar um novo conjunto de dados mantendo ou removendo certas variáveis de um conjunto de dados existente.

Normalmente, usamos a instrução KEEP quando queremos manter apenas algumas variáveis do conjunto de dados original, porque isso é mais rápido do que inserir todas as variáveis que queremos remover.

Alternativamente, normalmente usamos a instrução DROP quando queremos remover apenas algumas variáveis do conjunto de dados original, porque isso é mais rápido do que inserir todas as variáveis que queremos manter.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como renomear variáveis no SAS
Como criar novas variáveis no SAS
Como substituir caracteres em uma string no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *