Como usar proc rank em sas (com exemplos)
Você pode usar PROC RANK no SAS para calcular a classificação de uma ou mais variáveis numéricas.
Aqui estão as quatro maneiras mais comuns de usar este procedimento:
Método 1: classificar uma variável
proc rank data =original_data out =ranked_data;
var var1;
ranks var1_rank;
run ;
Método 2: classificar uma variável por grupo
proc rank data =original_data out =ranked_data;
var var1;
by var2;
ranks var1_rank;
run ;
Método 3: Classifique uma variável em percentis
proc rank data =original_data groups =4 out =ranked_data;
var var1;
ranks var1_rank;
run ;
Método 4: classificar múltiplas variáveis
proc rank data =original_data out =ranked_data;
var var1 var2;
ranks var1_rank var2_rank;
run ;
Os exemplos a seguir mostram como usar cada método com o seguinte conjunto de dados no SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
At 25 10
At 18 4
At 18 7
At 24 8
B 27 9
B 33 13
B 31 11
B 30 16
;
run ;
/*view dataset*/
proc print data = original_data;
Exemplo 1: variável de classificação um
O código a seguir mostra como criar uma nova variável chamada points_rank que classifica os pontos marcados por cada equipe:
/*rank points scored by team*/
proc rank data =original_data out =ranked_data;
var points;
ranks points_rank;
run ;
/*view ranks*/
proc print data =ranked_data;
A equipe com mais pontos recebe a classificação mais alta e a equipe com menos pontos recebe a classificação mais baixa.
Qualquer empate em pontos marcados recebe uma classificação média. Por exemplo, as linhas com a primeira e a segunda pontuação mais baixa recebem uma classificação de 1,5, pois é a média de 1 e 2.
Observe que você pode usar a instrução decrescente para atribuir à equipe com mais pontos a classificação mais baixa :
/*rank points scored by team in descending order*/
proc rank data =original_data descending out =ranked_data;
var points;
ranks points_rank;
run ;
/*view ranks*/
proc print data =ranked_data;
Exemplo 2: variável de classificação um por grupo
O código a seguir mostra como criar uma nova variável chamada points_rank que classifica os pontos marcados, agrupados por equipe:
/*rank points scored, grouped by team*/
proc rank data =original_data out =ranked_data;
var points;
by team;
ranks points_rank;
run ;
/*view ranks*/
proc print data =ranked_data;
Exemplo 3: Classifique uma variável em percentis
Podemos usar a instrução groups para classificar variáveis em grupos percentuais. Por exemplo, podemos classificar cada valor de ponto em um quartil (quatro grupos):
/*rank points into quartiles*/
proc rank data =original_data groups =4 out =ranked_data;
var points;
ranks points_rank;
run ;
/*view ranks*/
proc print data =ranked_data;
As linhas com valores de pontos no quartil mais baixo recebem um grupo de 0 , as linhas com pontos no próximo quartil mais baixo recebem um grupo de 1 e assim por diante.
Nota : Para atribuir valores em decis, basta usar groups=10 .
Exemplo 4: classificar múltiplas variáveis
O código a seguir mostra como criar novas variáveis para classificar pontos e rebotes :
proc rank data =original_data out =ranked_data;
var points rebounds;
ranks points_rank rebounds_rank;
run ;
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como usar o resumo do procedimento no SAS
Como usar o Proc Tabulate no SAS
Como usar o PROC Transpose no SAS
Como criar tabelas de frequência no SAS