Comment sous-ensembler des données dans SAS (3 exemples)
Voici les trois façons les plus courantes de sous-ensembler un ensemble de données dans SAS :
Méthode 1 : Choisissez les colonnes à conserver
data new_data;
set original_data;
keep var1 var3;
run;
Méthode 2 : choisissez les colonnes à supprimer
data new_data;
set original_data;
drop var4;
run;
Méthode 3 : Choisissez les lignes à conserver en fonction de la condition
data new_data;
set original_data;
if var1 < 25 then delete;
run;
Les exemples suivants montrent comment utiliser chaque méthode avec l’ensemble de données suivant dans SAS :
/*create dataset*/
data original_data;
input team $ points rebounds;
datalines;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run;
/*view dataset*/
proc print data=original_data;
Exemple 1 : Choisissez les colonnes à conserver
Le code suivant montre comment créer un sous-ensemble d’un ensemble de données à l’aide de l’instruction KEEP pour conserver uniquement certaines colonnes :
/*create new dataset*/
data new_data;
set original_data;
keep team points;
run;
/*view new dataset*/
proc print data=new_data;
Exemple 2 : Choisissez les colonnes à supprimer
Le code suivant montre comment créer un sous-ensemble d’un ensemble de données à l’aide de l’instruction DROP pour supprimer des colonnes spécifiques :
/*create new dataset*/
data new_data;
set original_data;
drop points;
run;
/*view new dataset*/
proc print data=new_data;
Exemple 3 : Choisissez les lignes à conserver en fonction de la condition
Le code suivant montre comment créer un sous-ensemble d’un ensemble de données à l’aide de l’instruction DELETE pour supprimer des lignes spécifiques de l’ensemble de données dont la valeur dans la colonne de points est inférieure à 25 :
/*create new dataset*/
data new_data;
set original_data;
if points < 25 then delete;
run;
/*view new dataset*/
proc print data=new_data;
Vous pouvez également utiliser le OU « | » pour supprimer les lignes où les points sont inférieurs à 25 ou les rebonds sont inférieurs à 10 :
/*create new dataset*/
data new_data;
set original_data;
if points < 25 | rebounds < 10 then delete;
run;
/*view new dataset*/
proc print data=new_data;
Vous pouvez également utiliser l’opérateur AND « & » pour supprimer les lignes où les points sont inférieurs à 25 et les rebonds inférieurs à 10 :
/*create new dataset*/
data new_data;
set original_data;
if points < 25 & rebounds < 10 then delete;
run;
/*view new dataset*/
proc print data=new_data;
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :
Comment renommer des variables dans SAS
Comment créer de nouvelles variables dans SAS
Comment remplacer des caractères dans une chaîne dans SAS