Как извлечь числа из строки в sas


Самый простой способ извлечь числа из строки в SAS — использовать функцию COMPRESS с модификатором «A».

Эта функция использует следующий базовый синтаксис:

 data new_data;
    set original_data;
    numbers_only = compress(some_string, '', ' A ');
run ;

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: Извлечение чисел из строки в SAS

Предположим, у нас есть следующий набор данных в SAS, в котором показаны названия различных университетских курсов:

 /*create dataset*/
data original_data;
    input course $12.;
    datalines ;
Stats101
Economics203
Business201
Botany411
Calculus101
English201
Chemistry402
Physics102
;
run ;

/*view dataset*/
proc print data = original_data; 

Мы можем использовать следующий код, чтобы извлечь только цифры из каждого названия курса:

 /*extract numbers from course column*/
data new_data;
    set original_data;
    course_number_only = compress (course, '', ' A ');
run ;

/*view results*/
proc print data = new_data; 

Обратите внимание, что новый столбец с именем Course_number_only содержит только числа из строк в столбце Course .

Если вместо этого вы хотите извлечь только символы из каждой строки, вы можете использовать функцию COMPRESS с модификатором «d»:

 /*extract characters from course column*/
data new_data;
    set original_data;
    course_characters_only = compress (course, '', ' d ');
run ;

/*view results*/
proc print data = new_data; 

Обратите внимание, что новый столбец с именем Course_characters_only содержит только числа из строк в столбце курса .

Примечание . Полный список модификаторов функции COMPRESS можно найти на этой странице документации SAS .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

Как нормализовать данные в SAS
Как выявить выбросы в SAS
Как создать таблицы частот в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *