Comment sous-ensembler des données dans SAS (3 exemples)



Voici les trois façons les plus courantes de sous-ensembler un ensemble de données dans SAS :

Méthode 1 : Choisissez les colonnes à conserver

data new_data;
    set original_data;
    keep var1 var3;
run;

Méthode 2 : choisissez les colonnes à supprimer

data new_data;
    set original_data;
    drop var4;
run;

Méthode 3 : Choisissez les lignes à conserver en fonction de la condition

data new_data;
    set original_data;
    if var1 < 25 then delete;
run;

Les exemples suivants montrent comment utiliser chaque méthode avec l’ensemble de données suivant dans SAS :

/*create dataset*/
data original_data;
    input team $ points rebounds;
    datalines;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run;

/*view dataset*/
proc print data=original_data;

Exemple 1 : Choisissez les colonnes à conserver

Le code suivant montre comment créer un sous-ensemble d’un ensemble de données à l’aide de l’instruction KEEP pour conserver uniquement certaines colonnes :

/*create new dataset*/
data new_data;
    set original_data;
    keep team points;
run;

/*view new dataset*/
proc print data=new_data;

Exemple 2 : Choisissez les colonnes à supprimer

Le code suivant montre comment créer un sous-ensemble d’un ensemble de données à l’aide de l’instruction DROP pour supprimer des colonnes spécifiques :

/*create new dataset*/
data new_data;
    set original_data;
    drop points;
run;

/*view new dataset*/
proc print data=new_data;

Exemple 3 : Choisissez les lignes à conserver en fonction de la condition

Le code suivant montre comment créer un sous-ensemble d’un ensemble de données à l’aide de l’instruction DELETE pour supprimer des lignes spécifiques de l’ensemble de données dont la valeur dans la colonne de points est inférieure à 25 :

/*create new dataset*/
data new_data;
    set original_data;
    if points < 25 then delete;
run;

/*view new dataset*/
proc print data=new_data;

Vous pouvez également utiliser le OU « |  » pour supprimer les lignes où les points sont inférieurs à 25 ou les rebonds sont inférieurs à 10 :

/*create new dataset*/
data new_data;
    set original_data;
    if points < 25 | rebounds < 10 then delete;
run;

/*view new dataset*/
proc print data=new_data;

Vous pouvez également utiliser l’opérateur AND « & » pour supprimer les lignes où les points sont inférieurs à 25 et les rebonds inférieurs à 10 :

/*create new dataset*/
data new_data;
    set original_data;
    if points < 25 & rebounds < 10 then delete;
run;

/*view new dataset*/
proc print data=new_data;

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment renommer des variables dans SAS
Comment créer de nouvelles variables dans SAS
Comment remplacer des caractères dans une chaîne dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *