Sas: come utilizzare proc sort con nodupkey
È possibile utilizzare PROC SORT in SAS con NODUPKEY per ordinare le osservazioni in un set di dati in base a una o più variabili e rimuovere eventuali duplicati.
L’esempio seguente mostra come utilizzare questa procedura con il seguente set di dati in SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;
/*view dataset*/
proc print data = original_data;
Esempio: utilizzo di PROC SORT con NODUPKEY in SAS
Supponiamo di utilizzare semplicemente proc sort per ordinare le osservazioni nel set di dati in ordine crescente (dal più piccolo al più grande) in base al valore nella colonna dei punti :
/*sort by points ascending*/
proc sort data =original_data out =data2;
by points;
run ;
/*view sorted dataset*/
proc print data =data2;
Si noti che le osservazioni sono ordinate in ordine crescente in base al valore nella colonna dei punti .
Tuttavia, diverse osservazioni sono duplicate.
Per ordinare le osservazioni in base ai valori nella colonna dei punti e rimuovere tutti i duplicati, possiamo aggiungere nodupkey dopo l’istruzione proc sort :
/*sort by points ascending and remove duplicates*/
proc sort data =original_data out =data3 nodupkey ;
by points;
run ;
/*view sorted dataset*/
proc print data =data3;
Le osservazioni sono ora ordinate in ordine crescente in base al valore nella colonna dei punti e tutte le osservazioni duplicate sono state rimosse.
Tieni presente che possiamo anche aggiungere l’argomento discendente per ordinare le osservazioni in base al valore nella colonna dei punti in ordine decrescente e rimuovere tutti i duplicati:
/*sort by points descending and removing duplicates*/
proc sort data =original_data out =data4 nodupkey ;
by descending points;
run ;
/*view sorted dataset*/
proc print data =data4;
Le osservazioni sono ora ordinate in ordine decrescente in base al valore nella colonna dei punti e tutte le osservazioni duplicate sono state rimosse.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come utilizzare Proc Append in SAS
Come utilizzare Proc Tabulate in SAS
Come utilizzare le regole di confronto Proc in SAS