Sas: nodupkey와 함께 proc sort를 사용하는 방법


SAS에서 NODUPKEY 와 함께 PROC SORT를 사용하면 데이터 세트의 관측치를 하나 이상의 변수로 정렬하고 중복 항목을 제거할 수 있습니다.

다음 예에서는 SAS의 다음 데이터 세트에 이 절차를 사용하는 방법을 보여줍니다.

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data = original_data;

예: SAS에서 NODUPKEY와 함께 PROC SORT 사용

단순히 proc sort를 사용하여 포인트 열의 값을 기준으로 데이터 세트의 관측치를 오름차순(가장 작은 것부터 가장 큰 것까지)으로 정렬한다고 가정해 보겠습니다.

 /*sort by points ascending*/
proc sort data =original_data out =data2;
    by points;
run ;

/*view sorted dataset*/
proc print data =data2; 

관측치는 포인트 열의 값을 기준으로 오름차순으로 정렬됩니다.

그러나 여러 관측치가 중복됩니다.

포인트 열의 값을 기준으로 관측치를 정렬하고 모든 중복 항목을 제거하려면 proc sort 문 뒤에 nodupkey를 추가하면 됩니다.

 /*sort by points ascending and remove duplicates*/
proc sort data =original_data out =data3 nodupkey ;
    by points;
run ;

/*view sorted dataset*/
proc print data =data3; 

이제 관측치는 포인트 열의 값을 기준으로 오름차순으로 정렬되며 중복된 관측치는 제거되었습니다.

포인트 열의 값을 기준으로 관측치를 내림차순으로 정렬하고 모든 중복 항목을 제거하기 위해 내림차순 인수를 추가할 수도 있습니다.

 /*sort by points descending and removing duplicates*/
proc sort data =original_data out =data4 nodupkey ;
    by descending points;
run ;

/*view sorted dataset*/
proc print data =data4; 

이제 관측치는 포인트 열의 값을 기준으로 내림차순으로 정렬되며 모든 중복 관측치는 제거되었습니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 Proc Append를 사용하는 방법
SAS에서 Proc Tabulate를 사용하는 방법
SAS에서 Proc 대조를 사용하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다