Sas: 올바른 하위 문자열을 추출하는 방법


SAS의 SUBSTR 함수를 사용하여 문자열의 일부를 추출할 수 있습니다.

이 함수는 다음 기본 구문을 사용합니다.

SUBSTR(소스, 위치, N)

금:

  • 출처 : 분석할 채널
  • 위치 : 읽을 시작 위치
  • N : 읽을 문자 수

Position 인수의 값은 문자열 왼쪽의 시작 위치를 지정합니다.

대신 문자열 오른쪽에 시작 위치를 지정하려면 다음 구문을 사용할 수 있습니다.

 data new_data;
    set original_data;
    last_three = substr (team , length (team) -2,3 );
run ;

이 특정 예에서는 team 이라는 문자열 변수 오른쪽에 있는 마지막 세 문자를 추출하는 last_ three 라는 새 변수를 만듭니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: SAS의 Right에서 부분 문자열 추출

SAS에 다양한 농구팀에 대한 정보가 포함된 다음과 같은 데이터세트가 있다고 가정해 보겠습니다.

 /*create dataset*/
data original_data;
    input team $points;
    datalines ;
Mavericks 104
Thunder 99
Rockets 116
Spurs 98
Pistons 99
Pelicans 105
Warriors 119
Blazers 113
Nuggets 100
Kings 123
;
run ;

/*view dataset*/
proc print data = original_data;

다음 코드를 사용하여 변수에서 마지막 3자를 추출할 수 있습니다.

 /*create new dataset*/
data new_data;
    set original_data;
    last_three = substr (team , length (team) -2,3 );
run ;

/*view new dataset*/
proc print data = new_data; 

last_ three 라는 열에는 열의 마지막 세 문자가 포함되어 있습니다.

또한 SUBSTR 함수의 값을 쉽게 변경하여 문자열 오른쪽에서 다른 수의 문자를 추출할 수도 있습니다.

예를 들어, 다음 구문을 사용하여 오른쪽에서 마지막 5자를 추출할 수 있습니다.

 /*create new dataset*/
data new_data;
    set original_data;
    last_five = substr (team , length (team) -4,5 );
run ;

/*view new dataset*/
proc print data = new_data; 

last_five 라는 열에는 열의 마지막 5자가 포함되어 있습니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS: 문자열의 문자를 바꾸는 방법
SAS: 문자열에서 쉼표를 제거하는 방법
SAS: 문자열에서 숫자를 추출하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다