Sas에서 데이터 부분 집합을 만드는 방법(3가지 예)


SAS에서 데이터세트를 부분집합화하는 가장 일반적인 세 가지 방법은 다음과 같습니다.

방법 1: 유지할 열 선택

 data new_data;
    set original_data;
    keep var1 var3;
run ;

방법 2: 삭제할 열 선택

 data new_data;
    set original_data;
    dropvar4 ;
run ;

방법 3: 조건에 따라 유지할 행 선택

 data new_data;
    set original_data;
    if var1 < 25 then delete;
run ;

다음 예에서는 SAS의 다음 데이터 세트에 각 방법을 사용하는 방법을 보여줍니다.

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;

/*view dataset*/
proc print data = original_data; 

예 1: 유지할 열 선택

다음 코드는 특정 열만 유지하기 위해 KEEP 문을 사용하여 데이터세트의 하위 집합을 지정하는 방법을 보여줍니다.

 /*create new dataset*/
data new_data;
    set original_data;
    keep team points;
run ;

/*view new dataset*/
proc print data = new_data;

예시 2: 삭제할 열 선택

다음 코드는 특정 열을 삭제하기 위해 DROP 문을 사용하여 데이터세트의 하위 집합을 지정하는 방법을 보여줍니다.

 /*create new dataset*/
data new_data;
    set original_data;
    drop points;
run ;

/*view new dataset*/
proc print data = new_data;

예 3: 조건에 따라 유지할 행 선택

다음 코드는 포인트 열의 값이 25보다 작은 데이터세트에서 특정 행을 삭제하기 위해 DELETE 문을 사용하여 데이터세트를 부분 집합화하는 방법을 보여줍니다.

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 then delete;
run ;

/*view new dataset*/
proc print data = new_data;

OR|포인트가 25개 미만 이거나 리바운드가 10개 미만인 라인을 제거하려면 다음과 같이 하세요.

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 | rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

AND& ” 연산자를 사용하여 포인트가 25 미만 이고 바운스가 10 미만인 라인을 제거할 수도 있습니다.

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 & rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 변수 이름을 바꾸는 방법
SAS에서 새 변수를 만드는 방법
SAS에서 문자열의 문자를 바꾸는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다