Sas에서 substr 함수를 사용하는 방법(예제 포함)
SAS의 SUBSTR 함수를 사용하여 문자열의 일부를 추출할 수 있습니다.
이 함수는 다음 기본 구문을 사용합니다.
SUBSTR(소스, 위치, N)
금:
- 출처 : 분석할 채널
- 위치 : 읽을 시작 위치
- N : 읽을 문자 수
이 기능을 사용하는 가장 일반적인 네 가지 방법은 다음과 같습니다.
방법 1: 문자열에서 처음 N자를 추출합니다.
data new_data;
set original_data;
first_four = substr (string_variable, 1 , 4 );
run ;
방법 2: 문자열에서 특정 위치 범위의 문자 추출
data new_data;
set original_data;
two_through_five = substr (string_variable, 2 , 4 );
run ;
방법 3: 문자열에서 마지막 N자를 추출합니다.
data new_data;
set original_data;
last_three = substr (string_variable, length (string_variable)- 2 , 3 );
run ;
방법 4: 문자열에 문자가 있는 경우 새 변수 만들기
data new_data;
set original_data;
if substr (string_variable, 1 , 4 ) = ' some_string ' then new_var = ' Yes ';
else new_var = ' No ';
run ;
다음 예에서는 SAS의 다음 데이터 세트에 각 방법을 사용하는 방법을 보여줍니다.
/*create dataset*/
data original_data;
input team $1-10;
datalines ;
Warriors
Wizards
Rockets
Celtics
Thunder
;
run ;
/*view dataset*/
proc print data = original_data;
예시 1: 문자열에서 처음 N자를 추출합니다.
다음 코드는 팀 변수에서 처음 4자를 추출하는 방법을 보여줍니다.
/*create new dataset*/
data new_data;
set original_data;
first_four = substr (team, 1 , 4 );
run ;
/*view new dataset*/
proc print data = new_data;
first_four 변수에는 팀 변수의 처음 4개 문자가 포함되어 있습니다.
예시 2: 문자열에서 특정 위치 범위의 문자 추출
다음 코드는 팀 변수의 위치 2~5에서 문자를 추출하는 방법을 보여줍니다.
/*create new dataset*/
data new_data;
set original_data;
two_through_five = substr (team, 2 , 4 );
run ;
/*view new dataset*/
proc print data = new_data;
예시 3: 문자열에서 마지막 N자를 추출합니다.
다음 코드는 팀 변수에서 마지막 3자를 추출하는 방법을 보여줍니다.
/*create new dataset*/
data new_data;
set original_data;
last_three = substr (team , length (team) -2,3 );
run ;
/*view new dataset*/
proc print data = new_data;
예시 4: 문자열에 문자가 있는 경우 새 변수 만들기
다음 코드는 팀 이름의 첫 번째 문자가 “W”인 경우 ” yes “로 평가되고 첫 번째 문자가 “W”가 아닌 경우 ” no “로 평가되는 W_Team 이라는 새 변수를 만드는 방법을 보여줍니다.
/*create new dataset*/
data new_data;
set original_data;
if substr (team, 1 , 1 ) = ' W ' then W_Team = ' Yes ';
else W_Team = ' No ';
run ;
/*view new dataset*/
proc print data = new_data;
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
SAS에서 데이터를 정규화하는 방법
SAS에서 문자열의 문자를 바꾸는 방법
SAS에서 누락된 값을 0으로 바꾸는 방법
SAS에서 중복을 제거하는 방법