SAS : Comment utiliser PROC SORT avec l’instruction KEEP



Vous pouvez utiliser PROC SORT avec l’instruction KEEP dans SAS pour trier les lignes d’un ensemble de données et conserver uniquement des colonnes spécifiques après le tri.

Pour ce faire, vous pouvez utiliser la syntaxe de base suivante :

proc sort data=my_data out=sorted_data (keep=var1 var2);
    by var2;
run;

Cet exemple particulier trie les lignes de l’ensemble de données en fonction des valeurs de la colonne var2 , puis conserve uniquement les colonnes var1 et var2 après le tri.

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : utilisez PROC SORT avec l’instruction KEEP dans SAS

Supposons que nous disposions de l’ensemble de données suivant dans SAS qui contient des informations sur diverses équipes de basket-ball :

/*create dataset*/
data my_data;
    input team $ points assists;
    datalines;
Mavs 113 22
Pacers 95 19
Cavs 100 34
Lakers 114 20
Heat 123 39
Kings 100 22
Raptors 105 11
Hawks 95 25
Magic 103 26
Spurs 119 29
;
run;

/*view dataset*/
proc print data=my_data;

Nous pourrions utiliser la syntaxe suivante pour trier les lignes de l’ensemble de données en fonction des valeurs de la colonne de points :

/*sort rows in dataset based on values in points column*/
proc sort data=my_data out=sorted_data;
    by points;
run;

/*view sorted dataset*/
proc print data=sorted_data;

Notez que les lignes sont désormais triées par ordre croissant en fonction des valeurs de la colonne des points .

Par défaut, SAS conserve toutes les colonnes de l’ensemble de données après le tri.

Cependant, vous pouvez utiliser l’instruction KEEP pour spécifier les colonnes à conserver après le tri.

Par exemple, nous pouvons utiliser la syntaxe suivante pour trier les lignes de l’ensemble de données en fonction des valeurs de la colonne de points , puis conserver uniquement les colonnes d’équipe et de points :

/*sort rows in dataset based on values in points column and only keep team and points*/
proc sort data=my_data out=sorted_data (keep=team points);
    by points;
run;

/*view sorted dataset*/
proc print data=sorted_data;

Encore une fois, les lignes sont triées par ordre croissant en fonction des valeurs de la colonne de points , mais cette fois nous avons utilisé l’instruction KEEP pour conserver uniquement les colonnes d’équipe et de points après le tri.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment utiliser PROC SORT avec NODUPKEY dans SAS
Comment renommer des variables dans SAS
Comment créer de nouvelles variables dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *