Como usar proc rank em sas (com exemplos)


Você pode usar PROC RANK no SAS para calcular a classificação de uma ou mais variáveis numéricas.

Aqui estão as quatro maneiras mais comuns de usar este procedimento:

Método 1: classificar uma variável

 proc rank data =original_data out =ranked_data;
   var var1;
   ranks var1_rank;
run ;

Método 2: classificar uma variável por grupo

 proc rank data =original_data out =ranked_data;
   var var1;
   by var2;
   ranks var1_rank;
run ;

Método 3: Classifique uma variável em percentis

 proc rank data =original_data groups =4 out =ranked_data;
   var var1;
   ranks var1_rank;
run ;

Método 4: classificar múltiplas variáveis

 proc rank data =original_data out =ranked_data;
   var var1 var2;
   ranks var1_rank var2_rank;
run ;

Os exemplos a seguir mostram como usar cada método com o seguinte conjunto de dados no SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
At 25 10
At 18 4
At 18 7
At 24 8
B 27 9
B 33 13
B 31 11
B 30 16
;
run ;

/*view dataset*/
proc print data = original_data; 

Exemplo 1: variável de classificação um

O código a seguir mostra como criar uma nova variável chamada points_rank que classifica os pontos marcados por cada equipe:

 /*rank points scored by team*/
proc rank data =original_data out =ranked_data;
   var points;
   ranks points_rank;
run ;

/*view ranks*/
proc print data =ranked_data;

A equipe com mais pontos recebe a classificação mais alta e a equipe com menos pontos recebe a classificação mais baixa.

Qualquer empate em pontos marcados recebe uma classificação média. Por exemplo, as linhas com a primeira e a segunda pontuação mais baixa recebem uma classificação de 1,5, pois é a média de 1 e 2.

Observe que você pode usar a instrução decrescente para atribuir à equipe com mais pontos a classificação mais baixa :

 /*rank points scored by team in descending order*/
proc rank data =original_data descending out =ranked_data;
    var points;
    ranks points_rank;
run ;

/*view ranks*/
proc print data =ranked_data; 

Exemplo 2: variável de classificação um por grupo

O código a seguir mostra como criar uma nova variável chamada points_rank que classifica os pontos marcados, agrupados por equipe:

 /*rank points scored, grouped by team*/
proc rank data =original_data out =ranked_data;
    var points;
    by team;
    ranks points_rank;
run ;

/*view ranks*/
proc print data =ranked_data; 

Exemplo 3: Classifique uma variável em percentis

Podemos usar a instrução groups para classificar variáveis em grupos percentuais. Por exemplo, podemos classificar cada valor de ponto em um quartil (quatro grupos):

 /*rank points into quartiles*/
proc rank data =original_data groups =4 out =ranked_data;
   var points;
   ranks points_rank;
run ;

/*view ranks*/
proc print data =ranked_data;

As linhas com valores de pontos no quartil mais baixo recebem um grupo de 0 , as linhas com pontos no próximo quartil mais baixo recebem um grupo de 1 e assim por diante.

Nota : Para atribuir valores em decis, basta usar groups=10 .

Exemplo 4: classificar múltiplas variáveis

O código a seguir mostra como criar novas variáveis para classificar pontos e rebotes :

 proc rank data =original_data out =ranked_data;
   var points rebounds;
   ranks points_rank rebounds_rank;
run ; 

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como usar o resumo do procedimento no SAS
Como usar o Proc Tabulate no SAS
Como usar o PROC Transpose no SAS
Como criar tabelas de frequência no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *