Sas: jak używać proc sort z nodupkey


Możesz użyć PROC SORT w SAS z NODUPKEY , aby posortować obserwacje w zbiorze danych według jednej lub więcej zmiennych i usunąć wszelkie duplikaty.

Poniższy przykład pokazuje, jak użyć tej procedury z następującym zestawem danych w SAS-owym:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data = original_data;

Przykład: użycie PROC SORT z NODUPKEY w SAS

Załóżmy, że po prostu używamy proc sort do sortowania obserwacji w zbiorze danych w porządku rosnącym (od najmniejszego do największego) w oparciu o wartość w kolumnie punktów :

 /*sort by points ascending*/
proc sort data =original_data out =data2;
    by points;
run ;

/*view sorted dataset*/
proc print data =data2; 

Należy pamiętać, że obserwacje są sortowane w porządku rosnącym na podstawie wartości w kolumnie punktów .

Jednak kilka obserwacji jest duplikatów.

Aby posortować obserwacje na podstawie wartości w kolumnie punkty i usunąć wszystkie duplikaty, możemy dodać nodupkey po instrukcji proc sort :

 /*sort by points ascending and remove duplicates*/
proc sort data =original_data out =data3 nodupkey ;
    by points;
run ;

/*view sorted dataset*/
proc print data =data3; 

Obserwacje są teraz sortowane w porządku rosnącym na podstawie wartości w kolumnie punktów , a wszelkie zduplikowane obserwacje zostały usunięte.

Zauważ, że możemy również dodać argument malejący , aby posortować obserwacje na podstawie wartości w kolumnie punktów w kolejności malejącej i usunąć wszystkie duplikaty:

 /*sort by points descending and removing duplicates*/
proc sort data =original_data out =data4 nodupkey ;
    by descending points;
run ;

/*view sorted dataset*/
proc print data =data4; 

Obserwacje są teraz sortowane w kolejności malejącej na podstawie wartości w kolumnie punktów , a wszystkie zduplikowane obserwacje zostały usunięte.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak używać Proc Append w SAS-ie
Jak używać Proc Tabulate w SAS-ie
Jak korzystać z sortowania Proc w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *