Sas: como usar a opção where com set


Você pode usar a opção WHERE com SET no SAS para criar um novo conjunto de dados que inclua apenas linhas de outro conjunto de dados onde determinadas condições forem atendidas.

Aqui estão duas maneiras comuns de usar essa opção na prática:

Método 1: use WHERE e SET com uma condição

 data new_data;
    set my_data ( where = (dots>20));
run ;

Este exemplo cria um novo conjunto de dados chamado new_data que inclui apenas linhas em my_data cujo valor na coluna de pontos é maior que 20.

Método 2: Use WHERE e SET com múltiplas condições

 data new_data;
    set my_data ( where = (points>20 or team="Rockets"));
run ;

Este exemplo cria um novo conjunto de dados chamado new_data que inclui apenas as linhas em my_data onde o valor na coluna de pontos é maior que 20 ou o valor na coluna da equipe é igual a Rockets.

Os exemplos a seguir mostram como usar cada método na prática com o seguinte conjunto de dados no SAS:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
Mavs 22 10
Rockets 12 14
Spurs 29 8
Kings 13 10
Warriors 44 10
Heat 18 8
Magic 11 5
Pelicans 19 3
Blazers 12 8
;
run ;

/*view dataset*/
proc print data =my_data; 

Exemplo 1: Use WHERE e SET com uma condição

Podemos usar a seguinte sintaxe para criar um novo conjunto de dados chamado new_data que inclui apenas as linhas em my_data onde o valor na coluna de pontos é maior que 20:

 /*create new dataset*/
data new_data;
    set my_data ( where = (dots>20));
run ;

/*view new dataset*/
proc print data = new_data; 

Observe que apenas as linhas com valor superior a 20 na coluna de pontos são incluídas neste conjunto de dados.

Exemplo 2: Usando WHERE e SET com múltiplas condições

Podemos usar a seguinte sintaxe para criar um novo conjunto de dados chamado new_data que inclui apenas as linhas em my_data onde o valor na coluna de pontos é maior que 20 ou o valor na coluna da equipe é igual a “Rockets”:

 /*create new dataset*/
data new_data;
    set my_data ( where = (points>20 or team="Rockets"));
run ;

/*view new dataset*/
proc print data = new_data; 

Observe que apenas as linhas com valor superior a 20 na coluna de pontos ou com valor “Foguetes” na coluna equipe são incluídas neste conjunto de dados.

Observação : você pode usar e em vez de ou para incluir apenas linhas que atendam a mais de uma condição.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como usar a instrução SET com vários conjuntos de dados no SAS
Como selecionar as primeiras N linhas de um conjunto de dados no SAS
Como excluir conjuntos de dados no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *