Come sottoinsiemi di dati in sas (3 esempi)
Ecco i tre modi più comuni per creare sottoinsiemi di un set di dati in SAS:
Metodo 1: scegli quali colonne mantenere
data new_data;
set original_data;
keep var1 var3;
run ;
Metodo 2: scegli quali colonne eliminare
data new_data;
set original_data;
dropvar4 ;
run ;
Metodo 3: scegli quali righe mantenere in base alla condizione
data new_data;
set original_data;
if var1 < 25 then delete;
run ;
Gli esempi seguenti mostrano come utilizzare ciascun metodo con il seguente set di dati in SAS:
/*create dataset*/
data original_data;
input team $pointsrebounds;
datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;
/*view dataset*/
proc print data = original_data;
Esempio 1: scegli quali colonne mantenere
Il codice seguente mostra come creare un sottoinsieme di un set di dati utilizzando l’istruzione KEEP per mantenere solo determinate colonne:
/*create new dataset*/
data new_data;
set original_data;
keep team points;
run ;
/*view new dataset*/
proc print data = new_data;
Esempio 2: scegli le colonne da eliminare
Il codice seguente mostra come creare un sottoinsieme di un set di dati utilizzando l’istruzione DROP per eliminare colonne specifiche:
/*create new dataset*/
data new_data;
set original_data;
drop points;
run ;
/*view new dataset*/
proc print data = new_data;
Esempio 3: scegli quali righe mantenere in base alla condizione
Il codice seguente mostra come creare un sottoinsieme di un set di dati utilizzando l’istruzione DELETE per eliminare righe specifiche dal set di dati il cui valore nella colonna punto è inferiore a 25:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Puoi anche usare l’ OR “ | ” per rimuovere le linee in cui i punti sono inferiori a 25 o i rimbalzi sono inferiori a 10:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 | rebounds < 10 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Puoi anche utilizzare l’operatore AND ” & ” per rimuovere le righe in cui i punti sono inferiori a 25 e i rimbalzi sono inferiori a 10:
/*create new dataset*/
data new_data;
set original_data;
if points < 25 & rebounds < 10 then delete;
run ;
/*view new dataset*/
proc print data = new_data;
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come rinominare le variabili in SAS
Come creare nuove variabili in SAS
Come sostituire i caratteri in una stringa in SAS