Comment utiliser _N_ dans SAS (3 exemples)
La variable automatique _N_ dans SAS est utilisée pour compter le nombre de boucles de l’étape de données.
Voici les façons les plus courantes d’utiliser _N_ dans la pratique :
Méthode 1 : utilisez _N_ pour sélectionner la première ligne de l’ensemble de données
data new_data;
set original_data;
if _N_ = 1 then output;
run;
Méthode 2 : utilisez _N_ pour sélectionner les N premières lignes de l’ensemble de données
data new_data;
set original_data;
if _N_ <= 5 then output; /*select first 5 rows*/
run;
Méthode 3 : utilisez _N_ pour ajouter des numéros de ligne à l’ensemble de données
data new_data;
set original_data;
row_number = _N_;
run;
Les exemples suivants montrent comment utiliser chaque méthode avec l’ensemble de données suivant dans SAS :
/*create dataset*/
data original_data;
input team $ points rebounds;
datalines;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run;
/*view dataset*/
proc print data=original_data;
Exemple 1 : utilisez _N_ pour sélectionner la première ligne de l’ensemble de données
Le code suivant montre comment utiliser _N_ pour sélectionner uniquement la première ligne de l’ensemble de données :
/*create new dataset that contains only the first row*/
data new_data;
set original_data;
if _N_ = 1 then output;
run;
/*view new dataset*/
proc print data=new_data;
Nous pouvons voir que le nouvel ensemble de données ne contient que la première ligne de l’ensemble de données d’origine.
Exemple 2 : utilisez _N_ pour sélectionner les N premières lignes de l’ensemble de données
Le code suivant montre comment utiliser _N_ pour sélectionner les cinq premières lignes de l’ensemble de données :
/*create new dataset that contains first 5 rows of original dataset*/
data new_data;
set original_data;
if _N_ <= 5 then output;
run;
/*view new dataset*/
proc print data=new_data;
Nous pouvons voir que le nouvel ensemble de données ne contient que les cinq premières lignes de l’ensemble de données d’origine.
Exemple 3 : utilisez _N_ pour ajouter des numéros de ligne à l’ensemble de données
Le code suivant montre comment utiliser _N_ pour ajouter une colonne qui affiche les numéros de ligne pour chaque ligne de l’ensemble de données :
/*create new dataset that contains column with row numbers*/
data new_data;
set original_data;
row_number = _N_;
run;
/*view new dataset*/
proc print data=new_data;
Nous pouvons voir que le nouvel ensemble de données comporte une colonne appelée row_number qui contient le numéro de ligne de chaque ligne de l’ensemble de données.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment utiliser le résumé de procédure dans SAS
Comment utiliser Proc Tabulate dans SAS
Comment renommer des variables dans SAS
Comment créer de nouvelles variables dans SAS