Jak usunąć wiersze z brakującymi wartościami w sas-ie


Aby usunąć wiersze z brakującymi wartościami ze zbioru danych w SAS-ie, możesz użyć następującej podstawowej składni:

 data new_data;
    set my_data;
    if cmiss(of _all_) then delete;
run ;

W tym konkretnym przykładzie tworzony jest nowy zbiór danych o nazwie new_data , w którym usunięto wszystkie wiersze z brakującymi wartościami w oryginalnym zbiorze danych o nazwie my_data .

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Usuń wiersze z brakującymi wartościami w SAS-ie

Załóżmy, że mamy następujący zbiór danych w SAS-ie, który zawiera informacje o różnych drużynach koszykówki:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
Mavs 113 22
Pacers 95.
Cavs. .
Lakers 114 20
Heat 123 39
Kings. 22
Raptors 105 11
Hawks 95 25
Magic 103 26
Spurs 119.
;
run ;

/*view dataset*/
proc print data =my_data; 

Należy zauważyć, że istnieje kilka wierszy z brakującymi wartościami.

Za pomocą poniższego kodu możemy utworzyć nowy zbiór danych, w którym usuwamy z istniejącego zbioru wszystkie wiersze, w których brakuje wartości w kolumnie:

 /*create new dataset that removes rows with missing values from existing dataset*/
data new_data;
    set my_data;
    if cmiss(of _all_) then delete;
run ;

/*view new dataset*/
proc print data =new_data;

Widzimy, że wszystkie wiersze z brakującymi wartościami zostały usunięte ze zbioru danych.

Uwaga nr 1 : Argument _all_ w funkcji CMISS określa, że SAS powinien szukać brakujących wartości we wszystkich kolumnach w każdym wierszu.

Uwaga #2 : Pełną dokumentację funkcji CMISS można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak usunąć duplikaty w SAS-ie
Jak policzyć brakujące wartości w SAS-ie
Jak zastąpić brakujące wartości zerem w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *