Як витягти рядок після певного символу в r


Щоб витягнути рядок після певного символу в R, можна використати такі методи:

Спосіб 1. Витягніть рядок після певних символів за допомогою Base R

 sub(' .*the ', '', my_string)

Спосіб 2: Витягніть рядок після певних символів за допомогою stringr

 library (stringr)

str_replace(my_string, ' (.*?)the(.*?) ', ' \\1 ')

Обидва ці приклади витягують рядок після шаблону «the» у my_string .

У наведених нижче прикладах показано, як використовувати кожен метод на практиці з таким кадром даних:

 #create data frame
df <- data. frame (team=c('theMavs', 'theHeat', 'theNets', 'theRockets'),
                 dots=c(114, 135, 119, 140))

#view data frame
df

        team points
1 theMavs 114
2 theHeat 135
3 theNets 119
4 theRockets 140

Приклад 1. Витягніть рядок після певних символів за допомогою Base R

У наведеному нижче коді показано, як витягнути рядок після “the” для кожного рядка в стовпці команди кадру даних:

 #create new column that extracts string after "the" in team column
df$team_name <- sub(' .*the ', '', df$team)

#view updated data frame
df

        team points team_name
1 theMavs 114 Mavs
2 theHeat 135 Heat
3 theNets 119 Nets
4 theRockets 140 Rockets

Зауважте, що новий стовпець під назвою team_name містить рядок після «the» для кожного рядка в стовпці team у кадрі даних.

Пов’язане : Вступ до sub() у R

Приклад 2: Витягніть рядок після певних символів за допомогою пакета stringr

У наведеному нижче коді показано, як витягти рядок після «the» для кожного рядка в стовпці team кадру даних за допомогою функції str_replace() із пакета stringr у R:

 library (stringr)

#create new column that extracts string after "the" in team column
df$team_name <- str_replace(df$team, ' (.*?)the(.*?)', '\\1 ')

#view updated data frame
df

           team points team_name
1 Mavs pro team 114 Mavs
2 team Heat pro 135 Heat
3 Nets pro team 119 Nets

Зауважте, що новий стовпець під назвою team_name містить рядок після «the» для кожного рядка в стовпці team у кадрі даних.

Це відповідає результатам використання функції sub() у базовому R.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як вибрати стовпці, що містять певний рядок у R
Як видалити символи з рядка в R
Як знайти розташування символу в рядку в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *