Sas에서 countw 함수를 사용하는 방법(예제 포함)
SAS의 COUNTW 함수를 사용하여 문자열의 단어 수를 계산할 수 있습니다.
이 함수는 다음 구문을 사용합니다.
COUNTW(문자열, <문자>, <수정자>)
금:
- string: 계산할 단어가 포함된 문자열
- 문자 : 문자 목록을 초기화하는 선택적 문자 상수
- edit : 단어 사이의 구분 기호로 계산할 문자 또는 기호를 지정하는 선택적 코드
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
예: SAS에서 COUNTW 함수를 사용하는 방법
SAS에 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.
/*create dataset*/
data my_data;
input phrase $char50. ;
datalines ;
Hey_everyone
What's going on today
Wow, what a great day
Let's have fun
We should play basketball
This weather is so so awesome
;
run ;
/*view dataset*/
proc print data =my_data;
다음 코드는 COUNTW 함수를 사용하여 표현식 열의 각 행에 있는 단어 수를 표시하는 새 열을 만드는 방법을 보여줍니다.
/*create new dataset that shows number of words in each row*/
data new_data;
set my_data;
word_count = countw (phrase);
run ;
/*view new dataset*/
proc print data =new_data;
기본적으로 COUNTW 함수는 공백만 단어 사이의 구분 기호로 간주합니다.
그래서:
- 첫 번째 문장에는 공백이 없으므로 COUNTW 함수는 총 한 단어만 계산합니다.
- 두 번째 문장에는 공백이 3개 있으므로 COUNTW 함수에는 총 4개의 단어가 있습니다.
- 세 번째 문장에는 공백이 4개 있으므로 COUNTW 함수에는 총 5개의 단어가 있습니다.
등등.
그러나 단어 사이의 구분 기호로도 간주되는 수정자 목록을 지정할 수 있습니다.
예를 들어 다음 구문을 사용하여 공백과 밑줄이 모두 단어 사이의 구분 기호로 간주되도록 지정할 수 있습니다.
/*create new dataset that shows number of words in each row*/
data new_data;
set my_data;
word_count = countw (phrase, '_');
run ;
/*view new dataset*/
proc print data =new_data;
밑줄도 단어 사이의 구분 기호로 간주되어야 함을 명확히 했기 때문에 새로운 word_count 열은 이제 첫 번째 문장의 단어 수를 정확하게 계산합니다.
참고 : SAS COUNTW 함수에 대한 전체 문서는 여기에서 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
SAS의 문자열에서 숫자를 추출하는 방법
SAS에서 SUBSTR 함수를 사용하는 방법
SAS 문자열에서 특수 문자를 제거하는 방법