Sas에서 countw 함수를 사용하는 방법(예제 포함)


SAS의 COUNTW 함수를 사용하여 문자열의 단어 수를 계산할 수 있습니다.

이 함수는 다음 구문을 사용합니다.

COUNTW(문자열, <문자>, <수정자>)

금:

  • string: 계산할 단어가 포함된 문자열
  • 문자 : 문자 목록을 초기화하는 선택적 문자 상수
  • edit : 단어 사이의 구분 기호로 계산할 문자 또는 기호를 지정하는 선택적 코드

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예: SAS에서 COUNTW 함수를 사용하는 방법

SAS에 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

 /*create dataset*/
data my_data;
    input phrase $char50. ;
    datalines ;
Hey_everyone
What's going on today
Wow, what a great day
Let's have fun
We should play basketball
This weather is so so awesome
;
run ;

/*view dataset*/
proc print data =my_data;

다음 코드는 COUNTW 함수를 사용하여 표현식 열의 각 행에 있는 단어 수를 표시하는 새 열을 만드는 방법을 보여줍니다.

 /*create new dataset that shows number of words in each row*/
data new_data;
    set my_data;
    word_count = countw (phrase);
run ;

/*view new dataset*/
proc print data =new_data; 

기본적으로 COUNTW 함수는 공백만 단어 사이의 구분 기호로 간주합니다.

그래서:

  • 첫 번째 문장에는 공백이 없으므로 COUNTW 함수는 총 단어만 계산합니다.
  • 두 번째 문장에는 공백이 3개 있으므로 COUNTW 함수에는 총 4개의 단어가 있습니다.
  • 세 번째 문장에는 공백이 4개 있으므로 COUNTW 함수에는 총 5개의 단어가 있습니다.

등등.

그러나 단어 사이의 구분 기호로도 간주되는 수정자 목록을 지정할 수 있습니다.

예를 들어 다음 구문을 사용하여 공백과 밑줄이 모두 단어 사이의 구분 기호로 간주되도록 지정할 수 있습니다.

 /*create new dataset that shows number of words in each row*/
data new_data;
    set my_data;
    word_count = countw (phrase, '_');
run ;

/*view new dataset*/
proc print data =new_data; 

밑줄도 단어 사이의 구분 기호로 간주되어야 함을 명확히 했기 때문에 새로운 word_count 열은 이제 첫 번째 문장의 단어 수를 정확하게 계산합니다.

참고 : SAS COUNTW 함수에 대한 전체 문서는 여기에서 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS의 문자열에서 숫자를 추출하는 방법
SAS에서 SUBSTR 함수를 사용하는 방법
SAS 문자열에서 특수 문자를 제거하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다