Sas: как извлечь правильную подстроку


Вы можете использовать функцию SUBSTR в SAS для извлечения части строки.

Эта функция использует следующий базовый синтаксис:

SUBSTR(Источник, Позиция, N)

Золото:

  • Источник : Канал для анализа
  • Позиция : начальная позиция для чтения.
  • N : количество символов для чтения.

Значение аргумента Position указывает начальную позицию слева от строки .

Чтобы вместо этого указать начальную позицию справа от строки , вы можете использовать следующий синтаксис:

 data new_data;
    set original_data;
    last_three = substr (team , length (team) -2,3 );
run ;

В этом конкретном примере создается новая переменная с именем Last_three , которая извлекает последние три символа справа от строковой переменной с именем Team .

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: Извлечение подстроки из Right в SAS

Предположим, у нас есть следующий набор данных в SAS, содержащий информацию о различных баскетбольных командах:

 /*create dataset*/
data original_data;
    input team $points;
    datalines ;
Mavericks 104
Thunder 99
Rockets 116
Spurs 98
Pistons 99
Pelicans 105
Warriors 119
Blazers 113
Nuggets 100
Kings 123
;
run ;

/*view dataset*/
proc print data = original_data;

Мы можем использовать следующий код, чтобы извлечь последние 3 символа из переменной команды :

 /*create new dataset*/
data new_data;
    set original_data;
    last_three = substr (team , length (team) -2,3 );
run ;

/*view new dataset*/
proc print data = new_data; 

Обратите внимание, что столбец с именем Last_three содержит последние три символа столбца команды .

Мы также можем легко изменить значения функции SUBSTR , чтобы извлечь другое количество символов из правой части строки.

Например, мы можем использовать следующий синтаксис для извлечения последних пяти символов справа:

 /*create new dataset*/
data new_data;
    set original_data;
    last_five = substr (team , length (team) -4,5 );
run ;

/*view new dataset*/
proc print data = new_data; 

Обратите внимание, что столбец с именем Last_five содержит последние пять символов столбца команды .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в SAS:

SAS: Как заменить символы в строке
SAS: Как удалить запятые из строки
SAS: Как извлечь числа из строки

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *