Как использовать функцию подстроки в r (4 примера)


Функцию substring() в R можно использовать для извлечения подстроки в векторе символов.

Эта функция использует следующий синтаксис:

 substring(text, first, last)

Золото:

  • текст: имя вектора символов
  • first: первый элемент для извлечения
  • последний: последний элемент для извлечения

Также обратите внимание, что функция substr() делает то же самое, но с немного другими именами аргументов:

 substr(text, first, last)

Золото:

  • x: имя вектора символов
  • начало: первый элемент для извлечения
  • стоп: последний элемент для извлечения

Примеры в этом руководстве показывают, как на практике использовать функцию substring() со следующим фреймом данных в R:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

Пример 1: Извлечение символов между определенными позициями

Следующий код показывает, как использовать функцию substring() для извлечения символов между позициями 2 и 5 столбца «команда»:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

Обратите внимание, что новый столбец содержит символы между позициями 2 и 5 столбца «команда».

Пример 2: Извлечение первых N символов

Следующий код показывает, как использовать функцию substring() для извлечения первых трех символов из столбца «команда»:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

Обратите внимание, что новый столбец содержит первые три символа столбца «команда».

Пример 3: Извлечение последних N символов

Следующий код показывает, как использовать функцию substring() для извлечения последних трех символов из столбца «команда»:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

Обратите внимание, что новый столбец содержит последние три символа столбца «команда».

Пример 4. Замена подстроки

Следующий код показывает, как использовать функцию substring() для замены первых 3 символов значений в столбце «команда» на 3 звездочки:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

Обратите внимание, что первые три символа названия каждой команды заменены звездочками.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции со строками в R:

Как использовать str_replace в R
Как выполнить частичное сопоставление строк в R
Как преобразовать строки в даты в R
Как преобразовать символ в число в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *