R에서 str_extract를 사용하는 방법(예제 포함)
R에 있는 stringr 패키지의 str_extract() 함수를 사용하여 일치하는 패턴을 문자열로 추출할 수 있습니다.
이 함수는 다음 구문을 사용합니다.
str_extract(string, pattern)
금:
- 문자열: 문자형 벡터
- 패턴: 추출할 패턴
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
예시 1: 문자열에서 패턴 추출
다음 코드는 R의 특정 문자열에서 “ther” 문자열을 추출하는 방법을 보여줍니다.
library (stringr)
#define string
some_string <- "Hey there my name is Doug"
#extract "ther" from string
str_extract(some_string, " ther ")
[1] “other”
“ther” 패턴이 문자열에서 성공적으로 추출되었습니다.
문자열에 존재하지 않는 패턴을 추출하려고 하면 단순히 결과적으로 NA를 받게 됩니다.
library (stringr)
#define string
some_string <- "Hey there my name is Doug"
#attempt to extract "apple" from string
str_extract(some_string, " apple ")
[1] NA
문자열에 “apple” 패턴이 존재하지 않으므로 NA 값이 반환되었습니다.
예시 2: 문자열에서 숫자 값 추출
다음 코드는 정규식 \\d+를 사용하여 문자열에서 숫자 값만 추출하는 방법을 보여줍니다.
library (stringr)
#define string
some_string <- "There are 350 apples over there"
#extract only numeric values from string
str_extract(some_string, " \\d+ ")
[1] "350"
예제 3: 문자열 벡터에서 문자 추출
다음 코드는 정규식 [az]+를 사용하여 문자열 벡터에서 문자만 추출하는 방법을 보여줍니다.
library (stringr)
#define vector of strings
some_strings <- c("4 apples", "3 bananas", "7 oranges")
#extract only characters from each string in vector
str_extract(some_strings, “ [az]+ ”)
[1] “apples” “bananas” “oranges”
각 문자열의 문자만 반환됩니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 str_replace를 사용하는 방법
R에서 str_split을 사용하는 방법
R에서 str_Detect를 사용하는 방법