SAS : Comment utiliser les instructions KEEP et DROP



Vous pouvez utiliser les instructions KEEP et DROP dans SAS lors de la création d’un nouvel ensemble de données pour conserver ou supprimer des variables spécifiques d’un ensemble de données existant.

Ces instructions utilisent la syntaxe de base suivante :

Méthode 1 : Choisissez les colonnes à CONSERVER

data new_data;
    set original_data;
    keep var1 var3;
run;

Méthode 2 : choisissez les colonnes à supprimer

data new_data;
    set original_data;
    drop var5;
run;

Les exemples suivants montrent comment utiliser chaque méthode avec l’ensemble de données suivant dans SAS :

/*create dataset*/
data original_data;
    input team $ points rebounds;
    datalines;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run;

/*view dataset*/
proc print data=original_data;

Exemple 1 : Choisissez les colonnes à CONSERVER

Le code suivant montre comment créer un nouvel ensemble de données dans SAS en utilisant l’instruction KEEP pour conserver uniquement les variables d’équipe et de rebond de l’ensemble de données d’origine :

/*create new dataset*/
data new_data;
    set original_data;
    keep team rebounds;
run;

/*view new dataset*/
proc print data=new_data;

Notez que nous avons conservé les variables d’équipe et de rebond de l’ensemble de données d’origine et que toutes les autres variables ont simplement été supprimées.

Exemple 2 : Choisissez les colonnes à supprimer

Le code suivant montre comment créer un nouvel ensemble de données dans SAS en utilisant l’instruction DROP pour supprimer la variable rebonds de l’ensemble de données d’origine :

/*create new dataset*/
data new_data;
    set original_data;
    drop rebounds;
run;

/*view new dataset*/
proc print data=new_data;

Notez que la variable rebonds a été supprimée de l’ensemble de données tandis que toutes les autres variables de l’ensemble de données d’origine ont été conservées.

KEEP vs DROP : quelle instruction devriez-vous utiliser ?

Les instructions KEEP et DROP aboutissent au même résultat : elles vous permettent toutes deux de créer un nouvel ensemble de données en conservant ou en supprimant certaines variables d’un ensemble de données existant.

En règle générale, nous utilisons l’instruction KEEP lorsque nous souhaitons uniquement conserver quelques variables de l’ensemble de données d’origine, car cela est plus rapide que de saisir toutes les variables que nous souhaitons supprimer.

À l’inverse, nous utilisons généralement l’instruction DROP lorsque nous souhaitons uniquement supprimer quelques variables de l’ensemble de données d’origine, car cela est plus rapide que de saisir toutes les variables que nous souhaitons conserver.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment renommer des variables dans SAS
Comment créer de nouvelles variables dans SAS
Comment remplacer des caractères dans une chaîne dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *