Jak usunąć wiersze z brakującymi wartościami w sas-ie
Aby usunąć wiersze z brakującymi wartościami ze zbioru danych w SAS-ie, możesz użyć następującej podstawowej składni:
data new_data;
set my_data;
if cmiss(of _all_) then delete;
run ;
W tym konkretnym przykładzie tworzony jest nowy zbiór danych o nazwie new_data , w którym usunięto wszystkie wiersze z brakującymi wartościami w oryginalnym zbiorze danych o nazwie my_data .
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Usuń wiersze z brakującymi wartościami w SAS-ie
Załóżmy, że mamy następujący zbiór danych w SAS-ie, który zawiera informacje o różnych drużynach koszykówki:
/*create dataset*/
data my_data;
input team $points assists;
datalines ;
Mavs 113 22
Pacers 95.
Cavs. .
Lakers 114 20
Heat 123 39
Kings. 22
Raptors 105 11
Hawks 95 25
Magic 103 26
Spurs 119.
;
run ;
/*view dataset*/
proc print data =my_data;
Należy zauważyć, że istnieje kilka wierszy z brakującymi wartościami.
Za pomocą poniższego kodu możemy utworzyć nowy zbiór danych, w którym usuwamy z istniejącego zbioru wszystkie wiersze, w których brakuje wartości w kolumnie:
/*create new dataset that removes rows with missing values from existing dataset*/
data new_data;
set my_data;
if cmiss(of _all_) then delete;
run ;
/*view new dataset*/
proc print data =new_data;
Widzimy, że wszystkie wiersze z brakującymi wartościami zostały usunięte ze zbioru danych.
Uwaga nr 1 : Argument _all_ w funkcji CMISS określa, że SAS powinien szukać brakujących wartości we wszystkich kolumnach w każdym wierszu.
Uwaga #2 : Pełną dokumentację funkcji CMISS można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak usunąć duplikaty w SAS-ie
Jak policzyć brakujące wartości w SAS-ie
Jak zastąpić brakujące wartości zerem w SAS-ie