Sas의 문자열에서 숫자를 추출하는 방법


SAS의 문자열에서 숫자를 추출하는 가장 쉬운 방법은 “A” 수정자와 함께 COMPRESS 함수를 사용하는 것입니다.

이 함수는 다음 기본 구문을 사용합니다.

 data new_data;
    set original_data;
    numbers_only = compress(some_string, '', ' A ');
run ;

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: SAS의 문자열에서 숫자 추출

SAS에 다양한 대학 과정의 이름을 표시하는 다음과 같은 데이터 세트가 있다고 가정합니다.

 /*create dataset*/
data original_data;
    input course $12.;
    datalines ;
Stats101
Economics203
Business201
Botany411
Calculus101
English201
Chemistry402
Physics102
;
run ;

/*view dataset*/
proc print data = original_data; 

다음 코드를 사용하여 각 코스 이름에서 숫자만 추출할 수 있습니다.

 /*extract numbers from course column*/
data new_data;
    set original_data;
    course_number_only = compress (course, '', ' A ');
run ;

/*view results*/
proc print data = new_data; 

course_number_only 라는 새 열에는 강좌 열에 있는 문자열의 숫자만 포함되어 있습니다.

대신 각 문자열에서 문자만 추출하려면 ‘d’ 수정자와 함께 COMPRESS 함수를 사용할 수 있습니다.

 /*extract characters from course column*/
data new_data;
    set original_data;
    course_characters_only = compress (course, '', ' d ');
run ;

/*view results*/
proc print data = new_data; 

course_characters_only 라는 새 열에는 강좌 열에 있는 문자열의 숫자만 포함되어 있습니다.

참고 : 이 SAS 문서 페이지 에서 COMPRESS 함수에 대한 전체 수정자 목록을 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 데이터를 정규화하는 방법
SAS에서 이상값을 식별하는 방법
SAS에서 빈도표를 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다