Comment utiliser _N_ dans SAS (3 exemples)



La variable automatique _N_ dans SAS est utilisée pour compter le nombre de boucles de l’étape de données.

Voici les façons les plus courantes d’utiliser _N_ dans la pratique :

Méthode 1 : utilisez _N_ pour sélectionner la première ligne de l’ensemble de données

data new_data;
    set original_data;
    if _N_ = 1 then output;
run;

Méthode 2 : utilisez _N_ pour sélectionner les N premières lignes de l’ensemble de données

data new_data;
    set original_data;
    if _N_ <= 5 then output; /*select first 5 rows*/
run;

Méthode 3 : utilisez _N_ pour ajouter des numéros de ligne à l’ensemble de données

data new_data;
    set original_data;
    row_number = _N_;
run;

Les exemples suivants montrent comment utiliser chaque méthode avec l’ensemble de données suivant dans SAS :

/*create dataset*/
data original_data;
    input team $ points rebounds;
    datalines;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
Mavericks 34 10
Kings 22 11
Pelicans 39 23
;
run;

/*view dataset*/
proc print data=original_data;

Exemple 1 : utilisez _N_ pour sélectionner la première ligne de l’ensemble de données

Le code suivant montre comment utiliser _N_ pour sélectionner uniquement la première ligne de l’ensemble de données :

/*create new dataset that contains only the first row*/
data new_data;
    set original_data;
    if _N_ = 1 then output;
run;

/*view new dataset*/
proc print data=new_data;

Nous pouvons voir que le nouvel ensemble de données ne contient que la première ligne de l’ensemble de données d’origine.

Exemple 2 : utilisez _N_ pour sélectionner les N premières lignes de l’ensemble de données

Le code suivant montre comment utiliser _N_ pour sélectionner les cinq premières lignes de l’ensemble de données :

/*create new dataset that contains first 5 rows of original dataset*/
data new_data;
    set original_data;
    if _N_ <= 5 then output;
run;

/*view new dataset*/
proc print data=new_data;

Nous pouvons voir que le nouvel ensemble de données ne contient que les cinq premières lignes de l’ensemble de données d’origine.

Exemple 3 : utilisez _N_ pour ajouter des numéros de ligne à l’ensemble de données

Le code suivant montre comment utiliser _N_ pour ajouter une colonne qui affiche les numéros de ligne pour chaque ligne de l’ensemble de données :

/*create new dataset that contains column with row numbers*/
data new_data;
    set original_data;
    row_number = _N_;
run;

/*view new dataset*/
proc print data=new_data;

Nous pouvons voir que le nouvel ensemble de données comporte une colonne appelée row_number qui contient le numéro de ligne de chaque ligne de l’ensemble de données.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment utiliser le résumé de procédure dans SAS
Comment utiliser Proc Tabulate dans SAS
Comment renommer des variables dans SAS
Comment créer de nouvelles variables dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *