Sas: come utilizzare le istruzioni keep e drop
È possibile utilizzare le istruzioni KEEP e DROP in SAS durante la creazione di un nuovo set di dati per mantenere o rimuovere variabili specifiche da un set di dati esistente.
Queste istruzioni utilizzano la seguente sintassi di base:
Metodo 1: scegli quali colonne MANTENERE
data new_data;
set original_data;
keep var1 var3;
run ;
Metodo 2: scegli quali colonne eliminare
data new_data;
set original_data;
dropvar5 ;
run ;
Gli esempi seguenti mostrano come utilizzare ciascun metodo con il seguente set di dati in SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;
/*view dataset*/
proc print data = original_data;
Esempio 1: scegli le colonne da MANTENERE
Il codice seguente dimostra come creare un nuovo set di dati in SAS utilizzando l’istruzione KEEP per conservare solo le variabili di spostamento e rimbalzo dal set di dati originale:
/*create new dataset*/
data new_data;
set original_data;
keep team rebounds;
run ;
/*view new dataset*/
proc print data = new_data;
Tieni presente che abbiamo mantenuto le variabili di squadra e di rimbalzo dal set di dati originale e tutte le altre variabili sono state semplicemente rimosse.
Esempio 2: scegli le colonne da eliminare
Il codice seguente mostra come creare un nuovo set di dati in SAS utilizzando l’istruzione DROP per rimuovere la variabile rimbalzi dal set di dati originale:
/*create new dataset*/
data new_data;
set original_data;
drop rebounds;
run ;
/*view new dataset*/
proc print data = new_data;
Tieni presente che la variabile rimbalzi è stata rimossa dal set di dati mentre tutte le altre variabili del set di dati originale sono state mantenute.
MANTENERE vs. DROP: quale affermazione dovresti usare?
Le istruzioni KEEP e DROP ottengono lo stesso risultato: entrambe consentono di creare un nuovo set di dati mantenendo o rimuovendo determinate variabili da un set di dati esistente.
In genere, utilizziamo l’istruzione KEEP quando vogliamo mantenere solo alcune variabili del set di dati originale, perché è più veloce che inserire tutte le variabili che vogliamo rimuovere.
In alternativa, in genere utilizziamo l’istruzione DROP quando vogliamo rimuovere solo alcune variabili dal set di dati originale, perché è più veloce che inserire tutte le variabili che vogliamo mantenere.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come rinominare le variabili in SAS
Come creare nuove variabili in SAS
Come sostituire i caratteri in una stringa in SAS