Sas: proc sort gebruiken met nodupkey
U kunt PROC SORT in SAS met NODUPKEY gebruiken om observaties in een dataset te sorteren op een of meer variabelen en eventuele duplicaten te verwijderen.
In het volgende voorbeeld ziet u hoe u deze procedure kunt gebruiken met de volgende gegevensset in SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;
/*view dataset*/
proc print data = original_data;
Voorbeeld: PROC SORT gebruiken met NODUPKEY in SAS
Stel dat we eenvoudigweg proc sort gebruiken om de waarnemingen in de dataset in oplopende volgorde (van klein naar groot) te sorteren op basis van de waarde in de puntenkolom :
/*sort by points ascending*/
proc sort data =original_data out =data2;
by points;
run ;
/*view sorted dataset*/
proc print data =data2;
Houd er rekening mee dat de waarnemingen in oplopende volgorde worden gesorteerd op basis van de waarde in de puntenkolom .
Verschillende waarnemingen zijn echter duplicaten.
Om de waarnemingen te sorteren op basis van de waarden in de puntenkolom en alle duplicaten te verwijderen, kunnen we nodupkey toevoegen na de proc sort- instructie:
/*sort by points ascending and remove duplicates*/
proc sort data =original_data out =data3 nodupkey ;
by points;
run ;
/*view sorted dataset*/
proc print data =data3;
Waarnemingen worden nu in oplopende volgorde gesorteerd op basis van de waarde in de puntenkolom en eventuele dubbele waarnemingen zijn verwijderd.
Merk op dat we ook het aflopende argument kunnen toevoegen om de waarnemingen te sorteren op basis van de waarde in de puntenkolom in aflopende volgorde en alle duplicaten te verwijderen:
/*sort by points descending and removing duplicates*/
proc sort data =original_data out =data4 nodupkey ;
by descending points;
run ;
/*view sorted dataset*/
proc print data =data4;
Waarnemingen worden nu in aflopende volgorde gesorteerd op basis van de waarde in de puntenkolom en alle dubbele waarnemingen zijn verwijderd.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Proc Append gebruiken in SAS
Proc-tabel gebruiken in SAS
Proc-collatie gebruiken in SAS