SAS : Comment utiliser SELECT DISTINCT dans PROC SQL



Vous pouvez utiliser l’instruction SELECT DISTINCT dans PROC SQL dans SAS pour sélectionner uniquement des lignes uniques dans un ensemble de données.

L’exemple suivant montre comment utiliser cette instruction dans la pratique.

Exemple : utilisation de SELECT DISTINCT dans SAS

Supposons que nous ayons l’ensemble de données suivant dans SAS qui contient des informations sur divers joueurs de basket-ball :

/*create dataset*/
data my_data;
    input team $ position $ points;
    datalines;
A Guard 14
A Guard 14
A Guard 24
A Forward 13
A Forward 13
B Guard 22
B Guard 22
B Forward 34
C Forward 15
C Forward 18
;
run;

/*view dataset*/
proc print data=my_data;

Nous pouvons utiliser l’instruction SELECT DISTINCT dans PROC SQL pour sélectionner toutes les lignes uniques de l’ensemble de données :

/*select all unique rows*/
proc sql;
    select distinct *
    from my_data;
quit;

Remarque : Le symbole étoile ( * ) après SELECT DISTINCT indique à SAS de sélectionner toutes les colonnes de l’ensemble de données.

Notez que toutes les lignes uniques sont affichées dans la sortie.

Par exemple, plusieurs lignes ont une valeur d’équipe de A , une valeur de position de Forward et une valeur de points de 13 , mais une seule de ces lignes est affichée.

Notez que nous pouvons également spécifier les colonnes que nous souhaitons sélectionner :

/*select all unique combinations of team and position*/
proc sql;
    select distinct team, position
    from my_data;
quit;

Notez que seules les combinaisons uniques d’équipes et de postes sont affichées dans le résultat.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

SAS : Comment utiliser ORDER BY dans PROC SQL
SAS : Comment utiliser CONTAINS dans PROC SQL
SAS : Comment utiliser l’opérateur WHERE dans PROC SQL

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *