SAS : Comment utiliser PROC SORT avec NODUPKEY
Vous pouvez utiliser PROC SORT dans SAS avec NODUPKEY pour trier les observations dans un ensemble de données par une ou plusieurs variables et supprimer tous les doublons.
L’exemple suivant montre comment utiliser cette procédure avec l’ensemble de données suivant dans SAS :
/*create dataset*/
data original_data;
input team $ points rebounds;
datalines;
A 12 8
A 12 8
A 12 8
A 23 9
A 20 12
A 14 7
A 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run;
/*view dataset*/
proc print data=original_data;
Exemple : Utilisation de PROC SORT avec NODUPKEY dans SAS
Supposons que nous utilisions simplement proc sort pour trier les observations dans l’ensemble de données par ordre croissant (du plus petit au plus grand) en fonction de la valeur dans la colonne des points :
/*sort by points ascending*/
proc sort data=original_data out=data2;
by points;
run;
/*view sorted dataset*/
proc print data=data2;
Notez que les observations sont triées par ordre croissant en fonction de la valeur dans la colonne des points .
Cependant, plusieurs observations sont des doublons.
Pour trier les observations en fonction des valeurs de la colonne des points et supprimer tous les doublons, nous pouvons ajouter nodupkey après l’instruction de tri proc :
/*sort by points ascending and remove duplicates*/
proc sort data=original_data out=data3 nodupkey;
by points;
run;
/*view sorted dataset*/
proc print data=data3;
Les observations sont désormais triées par ordre croissant en fonction de la valeur dans la colonne des points et toutes les observations en double ont été supprimées.
Notez que nous pouvons également ajouter l’argument décroissant pour trier les observations en fonction de la valeur dans la colonne des points par ordre décroissant et supprimer tous les doublons :
/*sort by points descending and remove duplicates*/
proc sort data=original_data out=data4 nodupkey;
by descending points;
run;
/*view sorted dataset*/
proc print data=data4;
Les observations sont désormais triées par ordre décroissant en fonction de la valeur dans la colonne des points et toutes les observations en double ont été supprimées.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment utiliser Proc Append dans SAS
Comment utiliser Proc Tabulate dans SAS
Comment utiliser le classement Proc dans SAS