Sas: so verwenden sie proc sort mit nodupkey


Sie können PROC SORT in SAS mit NODUPKEY verwenden, um Beobachtungen in einem Datensatz nach einer oder mehreren Variablen zu sortieren und alle Duplikate zu entfernen.

Das folgende Beispiel zeigt, wie dieses Verfahren mit dem folgenden Datensatz in SAS verwendet wird:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data = original_data;

Beispiel: Verwendung von PROC SORT mit NODUPKEY in SAS

Angenommen, wir verwenden einfach proc sort , um die Beobachtungen im Datensatz in aufsteigender Reihenfolge (vom kleinsten zum größten) basierend auf dem Wert in der Punktespalte zu sortieren:

 /*sort by points ascending*/
proc sort data =original_data out =data2;
    by points;
run ;

/*view sorted dataset*/
proc print data =data2; 

Beachten Sie, dass die Beobachtungen in aufsteigender Reihenfolge basierend auf dem Wert in der Punktespalte sortiert werden.

Allerdings handelt es sich bei mehreren Beobachtungen um Duplikate.

Um die Beobachtungen basierend auf den Werten in der Punktespalte zu sortieren und alle Duplikate zu entfernen, können wir nach der proc sort- Anweisung nodupkey hinzufügen:

 /*sort by points ascending and remove duplicates*/
proc sort data =original_data out =data3 nodupkey ;
    by points;
run ;

/*view sorted dataset*/
proc print data =data3; 

Beobachtungen werden jetzt in aufsteigender Reihenfolge basierend auf dem Wert in der Punktespalte sortiert und alle doppelten Beobachtungen wurden entfernt.

Beachten Sie, dass wir auch das Argument „descending“ hinzufügen können, um die Beobachtungen basierend auf dem Wert in der Punktespalte in absteigender Reihenfolge zu sortieren und alle Duplikate zu entfernen:

 /*sort by points descending and removing duplicates*/
proc sort data =original_data out =data4 nodupkey ;
    by descending points;
run ;

/*view sorted dataset*/
proc print data =data4; 

Beobachtungen werden jetzt in absteigender Reihenfolge basierend auf dem Wert in der Punktespalte sortiert und alle doppelten Beobachtungen wurden entfernt.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:

So verwenden Sie Proc Append in SAS
So verwenden Sie Proc Tabulate in SAS
So verwenden Sie die Proc-Sortierung in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert