Comment compter les valeurs distinctes dans SAS : avec des exemples
Vous pouvez utiliser les méthodes suivantes pour compter des valeurs distinctes dans un ensemble de données dans SAS :
Méthode 1 : compter les valeurs distinctes dans une colonne
proc sql;
select count(distinct var1) as distinct_var1
from my_data;
quit;
Méthode 2 : compter les valeurs distinctes par groupe
proc sql;
select var1, count(distinct var2) as distinct_var2
from my_data
group by var1;
quit;
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec l’ensemble de données suivant :
/*create dataset*/
data my_data;
input team $ points;
datalines;
Mavs 10
Mavs 13
Mavs 13
Mavs 15
Mavs 15
Rockets 9
Rockets 10
Rockets 10
Spurs 18
Spurs 19
;
run;
/*view dataset*/
proc print data=my_data;
Exemple 1 : Compter les valeurs distinctes dans une colonne
Le code suivant montre comment compter le total des valeurs distinctes dans la colonne équipe :
/*count distinct values in team column*/
proc sql;
select count(distinct team) as distinct_teams
from my_data;
quit;
D’après le résultat, nous pouvons voir qu’il y a 3 valeurs distinctes dans la colonne équipe.
Nous pouvons le confirmer manuellement en observant qu’il existe trois équipes différentes : Mavs, Rockets et Spurs.
Exemple 2 : Compter les valeurs distinctes par groupe
Le code suivant montre comment compter les valeurs distinctes dans la colonne des points , regroupées par la colonne de l’ équipe :
/*count distinct values in points column, grouped by team*/
proc sql;
select team, count(distinct points) as distinct_points
from my_data
group by team;
quit;
Le tableau obtenu montre le nombre de valeurs distinctes dans la colonne des points, regroupées par chacune des équipes.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment créer des tableaux de fréquences dans SAS
Comment compter les observations par groupe dans SAS
Comment utiliser Proc Tabulate dans SAS