Como subconjunto de dados em sas (3 exemplos)


Aqui estão as três maneiras mais comuns de criar subconjuntos de um conjunto de dados no SAS:

Método 1: escolha quais colunas manter

 data new_data;
    set original_data;
    keep var1 var3;
run ;

Método 2: escolha quais colunas excluir

 data new_data;
    set original_data;
    dropvar4 ;
run ;

Método 3: escolha quais linhas manter com base na condição

 data new_data;
    set original_data;
    if var1 < 25 then delete;
run ;

Os exemplos a seguir mostram como usar cada método com o seguinte conjunto de dados no SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;

/*view dataset*/
proc print data = original_data; 

Exemplo 1: Escolha quais colunas manter

O código a seguir mostra como criar subconjuntos de um conjunto de dados usando a instrução KEEP para manter apenas determinadas colunas:

 /*create new dataset*/
data new_data;
    set original_data;
    keep team points;
run ;

/*view new dataset*/
proc print data = new_data;

Exemplo 2: Escolha as colunas a serem excluídas

O código a seguir mostra como criar subconjuntos de um conjunto de dados usando a instrução DROP para eliminar colunas específicas:

 /*create new dataset*/
data new_data;
    set original_data;
    drop points;
run ;

/*view new dataset*/
proc print data = new_data;

Exemplo 3: Escolha quais linhas manter com base na condição

O código a seguir mostra como criar um subconjunto de um conjunto de dados usando a instrução DELETE para excluir linhas específicas do conjunto de dados cujo valor na coluna de pontos é menor que 25:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 then delete;
run ;

/*view new dataset*/
proc print data = new_data;

Você também pode usar o OR| ”para remover linhas onde os pontos são inferiores a 25 ou os rebotes são inferiores a 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 | rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Você também pode usar o operador AND& ” para remover linhas onde os pontos são menores que 25 e os saltos são menores que 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 & rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como renomear variáveis no SAS
Como criar novas variáveis no SAS
Como substituir caracteres em uma string no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *