Sas: 올바른 하위 문자열을 추출하는 방법
SAS의 SUBSTR 함수를 사용하여 문자열의 일부를 추출할 수 있습니다.
이 함수는 다음 기본 구문을 사용합니다.
SUBSTR(소스, 위치, N)
금:
- 출처 : 분석할 채널
- 위치 : 읽을 시작 위치
- N : 읽을 문자 수
Position 인수의 값은 문자열 왼쪽의 시작 위치를 지정합니다.
대신 문자열 오른쪽에 시작 위치를 지정하려면 다음 구문을 사용할 수 있습니다.
data new_data;
set original_data;
last_three = substr (team , length (team) -2,3 );
run ;
이 특정 예에서는 team 이라는 문자열 변수 오른쪽에 있는 마지막 세 문자를 추출하는 last_ three 라는 새 변수를 만듭니다.
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: SAS의 Right에서 부분 문자열 추출
SAS에 다양한 농구팀에 대한 정보가 포함된 다음과 같은 데이터세트가 있다고 가정해 보겠습니다.
/*create dataset*/
data original_data;
input team $points;
datalines ;
Mavericks 104
Thunder 99
Rockets 116
Spurs 98
Pistons 99
Pelicans 105
Warriors 119
Blazers 113
Nuggets 100
Kings 123
;
run ;
/*view dataset*/
proc print data = original_data;
다음 코드를 사용하여 팀 변수에서 마지막 3자를 추출할 수 있습니다.
/*create new dataset*/
data new_data;
set original_data;
last_three = substr (team , length (team) -2,3 );
run ;
/*view new dataset*/
proc print data = new_data;
last_ three 라는 열에는 팀 열의 마지막 세 문자가 포함되어 있습니다.
또한 SUBSTR 함수의 값을 쉽게 변경하여 문자열 오른쪽에서 다른 수의 문자를 추출할 수도 있습니다.
예를 들어, 다음 구문을 사용하여 오른쪽에서 마지막 5자를 추출할 수 있습니다.
/*create new dataset*/
data new_data;
set original_data;
last_five = substr (team , length (team) -4,5 );
run ;
/*view new dataset*/
proc print data = new_data;
last_five 라는 열에는 팀 열의 마지막 5자가 포함되어 있습니다.
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
SAS: 문자열의 문자를 바꾸는 방법
SAS: 문자열에서 쉼표를 제거하는 방법
SAS: 문자열에서 숫자를 추출하는 방법