Как использовать str_sub в r (с примерами)


Функция str_sub() пакета stringr в R может использоваться для извлечения или замены подстрок в строке.

Эта функция использует следующий синтаксис:

str_sub(строка, начало, конец)

Золото:

  • строка: вектор символов
  • начало: позиция первого символа
  • конец: позиция последнего символа

В этом руководстве представлено несколько примеров того, как практически использовать эту функцию со следующим фреймом данных:

 #create data frame
df <- data. frame (team=c('team_A', 'team_B', 'team_C', 'team_D'),
                 conference=c('West', 'West', 'East', 'East'),
                 dots=c(88, 97, 94, 104))

#view data frame
df

    team conference points
1 team_A West 88
2 team_B West 97
3 team_C East 94
4 team_D East 104

Пример 1. Извлечение подстроки из строки

Следующий код показывает, как извлечь подстроку, которая начинается с позиции 5 и заканчивается в позиции 6, для каждой строки в столбце «команда»:

 library (stringr)

#extract characters in positions 5 through 6 of 'team' column
str_sub(string=df$team, start= 5 , end= 6 )

[1] "_A" "_B" "_C" "_D"

Пример 2: Извлечение подстроки в определенную позицию

Следующий код показывает, как извлечь каждый символ до позиции 4 для каждой строки в столбце «команда»:

 library (stringr)

#extract all characters up to position 4 in 'team' column
str_sub(string=df$team, end= 4 )

[1] "team" "team" "team" "team"

Пример 3: Извлечение подстроки из определенной позиции

Следующий код показывает, как извлечь каждый символ после позиции 3 для каждой строки в столбце «команда»:

 library (stringr)

#extract all characters after position 2 in 'team' column
str_sub(string=df$team, start= 3 )

[1] "am_A" "am_B" "am_C" "am_D"

Пример 4. Замена подстроки в строке

Следующий код показывает, как заменить подстроку, начинающуюся с позиции 1 и заканчивающуюся на позиции 5, для каждой строки в столбце «команда»:

 library (stringr)

#replace all characters between position 1 and 5 in 'team' column
str_sub(string=df$team, start= 1 , end= 5 ) <- 'TEAM'

#view updated data frame
df

   team conference points
1 TEAMA West 88
2 TEAMB West 97
3 TEAMC East 94
4 TEAMD East 104

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как использовать str_replace в R
Как использовать str_split в R
Как использовать str_detect в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *