Sas: jak używać proc sort z instrukcją keep


Możesz użyć PROC SORT z instrukcją KEEP w SAS-ie, aby posortować wiersze w zestawie danych i zachować tylko określone kolumny po posortowaniu.

Aby to zrobić, możesz użyć następującej podstawowej składni:

 proc sort data=my_data out =sorted_data ( keep =var1 var2);
    by var2;
run ;

Ten konkretny przykład sortuje wiersze w zbiorze danych na podstawie wartości w kolumnie var2 , a następnie po sortowaniu zachowuje tylko kolumny var1 i var2 .

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: użyj PROC SORT z instrukcją KEEP w SAS-ie

Załóżmy, że mamy następujący zbiór danych w SAS-ie, który zawiera informacje o różnych drużynach koszykówki:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
Mavs 113 22
Pacers 95 19
Cavs 100 34
Lakers 114 20
Heat 123 39
Kings 100 22
Raptors 105 11
Hawks 95 25
Magic 103 26
Spurs 119 29
;
run ;

/*view dataset*/
proc print data =my_data; 

Do sortowania wierszy zbioru danych na podstawie wartości w kolumnie punktów moglibyśmy zastosować następującą składnię:

 /*sort rows in dataset based on values in points column*/
proc sort data =my_data out =sorted_data;
    by points;
run ;

/*view sorted dataset*/
proc print data =sorted_data;

Zwróć uwagę, że wiersze są teraz posortowane rosnąco na podstawie wartości w kolumnie punktów .

Domyślnie SAS po posortowaniu zachowuje wszystkie kolumny w zbiorze danych.

Można jednak użyć instrukcji KEEP , aby określić, które kolumny zachować po sortowaniu.

Przykładowo możemy zastosować następującą składnię, aby posortować wiersze w zbiorze danych na podstawie wartości w kolumnie punkty , a następnie zachować tylko kolumny drużyny i punktów :

 /*sort rows in dataset based on values in points column and only keep team and points*/
proc sort data=my_data out =sorted_data ( keep =team points);
    by points;
run ;

/*view sorted dataset*/
proc print data =sorted_data; 

Ponownie wiersze są sortowane w kolejności rosnącej na podstawie wartości kolumn punktów , ale tym razem użyliśmy instrukcji KEEP , aby po posortowaniu zachować tylko kolumny drużyny i punktów .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak używać PROC SORT z NODUPKEY w SAS
Jak zmienić nazwy zmiennych w SAS-ie
Jak utworzyć nowe zmienne w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *