Как использовать функцию countw в sas (с примером)


Вы можете использовать функцию COUNTW в SAS для подсчета количества слов в строке.

Эта функция использует следующий синтаксис:

COUNTW(строка, <символ>, <модификатор>)

Золото:

  • строка: строка, содержащая слова для подсчета.
  • символ : необязательная символьная константа, которая инициализирует список символов.
  • изменить : дополнительные коды, которые определяют символы или символы, которые считаются разделителями между словами.

В следующем примере показано, как использовать эту функцию на практике.

Пример: Как использовать функцию COUNTW в SAS

Предположим, у нас есть следующий набор данных в SAS:

 /*create dataset*/
data my_data;
    input phrase $char50. ;
    datalines ;
Hey_everyone
What's going on today
Wow, what a great day
Let's have fun
We should play basketball
This weather is so so awesome
;
run ;

/*view dataset*/
proc print data =my_data;

Следующий код показывает, как использовать функцию COUNTW для создания нового столбца, отображающего количество слов в каждой строке столбца выражения :

 /*create new dataset that shows number of words in each row*/
data new_data;
    set my_data;
    word_count = countw (phrase);
run ;

/*view new dataset*/
proc print data =new_data; 

По умолчанию функция COUNTW рассматривает только пробелы как разделители между словами.

Так:

  • В первом предложении нет пробелов, поэтому функция COUNTW учитывает всего одно слово.
  • Во втором предложении три пробела, поэтому функция COUNTW содержит всего 4 слова.
  • В третьем предложении четыре пробела, поэтому функция COUNTW содержит всего 5 слов.

И так далее.

Однако мы можем указать список модификаторов, которые также считаются разделителями между словами.

Например, мы можем использовать следующий синтаксис, чтобы указать, что пробел и подчеркивание должны рассматриваться как разделители между словами:

 /*create new dataset that shows number of words in each row*/
data new_data;
    set my_data;
    word_count = countw (phrase, '_');
run ;

/*view new dataset*/
proc print data =new_data; 

Новый столбец word_count теперь точно подсчитывает количество слов в первом предложении, поскольку мы пояснили, что подчеркивание также следует рассматривать как разделитель между словами.

Примечание . Полную документацию по функции SAS COUNTW можно найти здесь .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как извлечь числа из строки в SAS
Как использовать функцию SUBSTR в SAS
Как удалить специальные символы из строк в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *