Come eliminare le righe con valori mancanti in sas
È possibile utilizzare la seguente sintassi di base per rimuovere righe con valori mancanti da un set di dati in SAS:
data new_data;
set my_data;
if cmiss(of _all_) then delete;
run ;
Questo particolare esempio crea un nuovo set di dati chiamato new_data in cui tutte le righe con valori mancanti nel set di dati originale chiamato my_data sono state rimosse.
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: eliminare le righe con valori mancanti in SAS
Supponiamo di avere il seguente set di dati in SAS che contiene informazioni su varie squadre di basket:
/*create dataset*/
data my_data;
input team $points assists;
datalines ;
Mavs 113 22
Pacers 95.
Cavs. .
Lakers 114 20
Heat 123 39
Kings. 22
Raptors 105 11
Hawks 95 25
Magic 103 26
Spurs 119.
;
run ;
/*view dataset*/
proc print data =my_data;
Tieni presente che sono presenti diverse righe con valori mancanti.
Possiamo utilizzare il seguente codice per creare un nuovo set di dati in cui rimuoviamo tutte le righe dal set di dati esistente che presentano valori mancanti in una colonna:
/*create new dataset that removes rows with missing values from existing dataset*/
data new_data;
set my_data;
if cmiss(of _all_) then delete;
run ;
/*view new dataset*/
proc print data =new_data;
Possiamo vedere che tutte le righe con valori mancanti sono state rimosse dal set di dati.
Nota n. 1 : l’argomento _all_ nella funzione CMISS specifica che SAS deve cercare i valori mancanti in tutte le colonne di ciascuna riga.
Nota n.2 : puoi trovare la documentazione completa della funzione CMISS qui .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in SAS:
Come rimuovere i duplicati in SAS
Come contare i valori mancanti in SAS
Come sostituire i valori mancanti con zero in SAS