Sas: como usar proc sort com a instrução keep


Você pode usar PROC SORT com a instrução KEEP no SAS para classificar linhas em um conjunto de dados e manter apenas colunas específicas após a classificação.

Para fazer isso, você pode usar a seguinte sintaxe básica:

 proc sort data=my_data out =sorted_data ( keep =var1 var2);
    by var2;
run ;

Este exemplo específico classifica as linhas do conjunto de dados com base nos valores da coluna var2 e mantém apenas as colunas var1 e var2 após a classificação.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Use PROC SORT com a instrução KEEP no SAS

Suponha que temos o seguinte conjunto de dados no SAS que contém informações sobre vários times de basquete:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
Mavs 113 22
Pacers 95 19
Cavs 100 34
Lakers 114 20
Heat 123 39
Kings 100 22
Raptors 105 11
Hawks 95 25
Magic 103 26
Spurs 119 29
;
run ;

/*view dataset*/
proc print data =my_data; 

Poderíamos usar a seguinte sintaxe para classificar as linhas do conjunto de dados com base nos valores da coluna de pontos :

 /*sort rows in dataset based on values in points column*/
proc sort data =my_data out =sorted_data;
    by points;
run ;

/*view sorted dataset*/
proc print data =sorted_data;

Observe que as linhas agora são classificadas em ordem crescente com base nos valores da coluna de pontos .

Por padrão, o SAS retém todas as colunas do conjunto de dados após a classificação.

No entanto, você pode usar a instrução KEEP para especificar quais colunas manter após a classificação.

Por exemplo, podemos usar a seguinte sintaxe para classificar as linhas do conjunto de dados com base nos valores da coluna de pontos e, em seguida, manter apenas as colunas de equipe e pontos :

 /*sort rows in dataset based on values in points column and only keep team and points*/
proc sort data=my_data out =sorted_data ( keep =team points);
    by points;
run ;

/*view sorted dataset*/
proc print data =sorted_data; 

Novamente, as linhas são classificadas em ordem crescente com base nos valores da coluna de pontos , mas desta vez usamos a instrução KEEP para manter apenas as colunas de equipe e pontos após a classificação.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como usar PROC SORT com NODUPKEY no SAS
Como renomear variáveis no SAS
Como criar novas variáveis no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *