Verwendung von proc rank in sas (mit beispielen)


Sie können PROC RANK in SAS verwenden, um den Rang einer oder mehrerer numerischer Variablen zu berechnen.

Hier sind die vier häufigsten Möglichkeiten, dieses Verfahren anzuwenden:

Methode 1: Rang einer Variablen

 proc rank data =original_data out =ranked_data;
   var var1;
   ranks var1_rank;
run ;

Methode 2: Eine Variable nach Gruppe klassifizieren

 proc rank data =original_data out =ranked_data;
   var var1;
   by var2;
   ranks var1_rank;
run ;

Methode 3: Ordnen Sie eine Variable in Perzentilen ein

 proc rank data =original_data groups =4 out =ranked_data;
   var var1;
   ranks var1_rank;
run ;

Methode 4: Mehrere Variablen klassifizieren

 proc rank data =original_data out =ranked_data;
   var var1 var2;
   ranks var1_rank var2_rank;
run ;

Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Datensatz in SAS verwendet wird:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
At 25 10
At 18 4
At 18 7
At 24 8
B 27 9
B 33 13
B 31 11
B 30 16
;
run ;

/*view dataset*/
proc print data = original_data; 

Beispiel 1: Variable mit Rang eins

Der folgende Code zeigt, wie eine neue Variable namens „points_rank“ erstellt wird, die die von jedem Team erzielten Punkte einordnet:

 /*rank points scored by team*/
proc rank data =original_data out =ranked_data;
   var points;
   ranks points_rank;
run ;

/*view ranks*/
proc print data =ranked_data;

Das Team mit den meisten Punkten erhält den höchsten Rang und das Team mit den wenigsten Punkten den niedrigsten Rang.

Bei Punktegleichheit wird ein Durchschnittsrang vergeben. Beispielsweise erhalten die Zeilen mit den ersten und zweitniedrigsten Punkten eine Rangfolge von 1,5, da es sich um den Durchschnitt von 1 und 2 handelt.

Beachten Sie, dass Sie stattdessen die absteigende Anweisung verwenden können, um dem Team mit den meisten Punkten den niedrigsten Rang zuzuweisen:

 /*rank points scored by team in descending order*/
proc rank data =original_data descending out =ranked_data;
    var points;
    ranks points_rank;
run ;

/*view ranks*/
proc print data =ranked_data; 

Beispiel 2: Variable mit Rang eins pro Gruppe

Der folgende Code zeigt, wie eine neue Variable namens „points_rank“ erstellt wird, die die erzielten Punkte nach Team gruppiert einordnet:

 /*rank points scored, grouped by team*/
proc rank data =original_data out =ranked_data;
    var points;
    by team;
    ranks points_rank;
run ;

/*view ranks*/
proc print data =ranked_data; 

Beispiel 3: Ordnen Sie eine Variable in Perzentilen ein

Mit der groups-Anweisung können wir Variablen in Perzentilgruppen sortieren. Beispielsweise können wir jeden Punktwert in ein Quartil (vier Gruppen) einteilen:

 /*rank points into quartiles*/
proc rank data =original_data groups =4 out =ranked_data;
   var points;
   ranks points_rank;
run ;

/*view ranks*/
proc print data =ranked_data;

Zeilen mit Punktwerten im untersten Quartil wird eine Gruppe von 0 zugewiesen, Zeilen mit Punkten im nächstniedrigeren Quartil wird eine Gruppe von 1 zugewiesen und so weiter.

Hinweis : Um Werte in Dezilen zuzuweisen, verwenden Sie einfach groups=10 .

Beispiel 4: Mehrere Variablen klassifizieren

Der folgende Code zeigt, wie man beide neuen Variablen zur Klassifizierung von Punkten und Rebounds erstellt:

 proc rank data =original_data out =ranked_data;
   var points rebounds;
   ranks points_rank rebounds_rank;
run ; 

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:

So verwenden Sie die Verfahrenszusammenfassung in SAS
So verwenden Sie Proc Tabulate in SAS
So verwenden Sie PROC Transpose in SAS
So erstellen Sie Häufigkeitstabellen in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert