Sas 문자열에서 특수 문자를 제거하는 방법


SAS의 문자열에서 특수 문자를 제거하는 가장 쉬운 방법은 ‘kas’ 수정자와 함께 COMPRESS 함수를 사용하는 것입니다.

이 함수는 다음 기본 구문을 사용합니다.

 data new_data;
    set original_data;
    remove_specials = compress (some_string, , ' kas ');
run ;

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: SAS의 문자열에서 특수 문자 제거

다양한 직원의 이름과 총 매출이 포함된 다음과 같은 데이터세트가 SAS에 있다고 가정해 보겠습니다.

 /*create dataset*/
data data1;
    input name $sales;
    datalines ;
Bob&%^ 45
M&$#@ike 50
Randy)) 39
Chad!? 14
Dan** 29
R[on] 44
;
run ;

/*view dataset*/
proc print data =data1; 

이름 열의 값에는 여러 특수 문자가 포함되어 있습니다.

COMPRESS 함수를 사용하여 다음 특수 문자를 제거할 수 있습니다.

 /*create second dataset with special characters removed from names*/
data data2;
  setdata1 ;
  new_name= compress (name, , ' kas ');
run ;

/*view dataset*/
proc print data =data2; 

new_name 열에는 특수 문자가 제거된 name 열의 값이 포함되어 있습니다.

다음은 이러한 특수 문자를 제거하기 위해 COMPRESS 함수가 수행한 작업입니다.

  • k는 특정 문자를 ‘유지’하고 싶다고 지정합니다.
  • 알파벳 문자를 유지하도록 지정 되었습니다.
  • 공백 문자를 유지하도록 지정됨

참고 : 이 SAS 문서 페이지 에서 COMPRESS 함수에 대한 전체 수정자 목록을 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS의 문자열에서 숫자를 추출하는 방법
SAS에서 SUBSTR 함수를 사용하는 방법
SAS에서 문자열을 대문자, 소문자 및 적절한 대소문자로 변환하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다