Как использовать str_extract в r (с примерами)
Функцию str_extract() пакета stringr в R можно использовать для извлечения совпадающих шаблонов в строку.
Эта функция использует следующий синтаксис:
str_extract(string, pattern)
Золото:
- строка: вектор символов
- шаблон: шаблон для извлечения
Следующие примеры показывают, как использовать эту функцию на практике.
Пример 1. Извлечение шаблона из строки
Следующий код показывает, как извлечь строку «ther» из определенной строки в R:
library (stringr)
#define string
some_string <- "Hey there my name is Doug"
#extract "ther" from string
str_extract(some_string, " ther ")
[1] “other”
Шаблон «ther» был успешно извлечен из строки.
Обратите внимание: если мы попытаемся извлечь шаблон, которого нет в строке, в результате мы просто получим NA :
library (stringr)
#define string
some_string <- "Hey there my name is Doug"
#attempt to extract "apple" from string
str_extract(some_string, " apple ")
[1] NA
Поскольку в строке не существовало шаблона «яблоко», было возвращено значение NA .
Пример 2: Извлечение числовых значений из строки
Следующий код показывает, как использовать регулярное выражение \\d+ для извлечения из строки только числовых значений:
library (stringr)
#define string
some_string <- "There are 350 apples over there"
#extract only numeric values from string
str_extract(some_string, " \\d+ ")
[1] "350"
Пример 3. Извлечение символов из вектора строк
Следующий код показывает, как использовать регулярное выражение [az]+ для извлечения только символов из вектора строк:
library (stringr)
#define vector of strings
some_strings <- c("4 apples", "3 bananas", "7 oranges")
#extract only characters from each string in vector
str_extract(some_strings, “ [az]+ ”)
[1] “apples” “bananas” “oranges”
Обратите внимание, что возвращаются только символы из каждой строки.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как использовать str_replace в R
Как использовать str_split в R
Как использовать str_detect в R