R で str_extract を使用する方法 (例あり)
R のstringrパッケージのstr_extract()関数を使用すると、一致するパターンを文字列に抽出できます。
この関数は次の構文を使用します。
str_extract(string, pattern)
金:
- string:文字ベクトル
- pattern:抽出するパターン
次の例は、この関数を実際に使用する方法を示しています。
例 1: 文字列からパターンを抽出する
次のコードは、R の特定の文字列から文字列「ther」を抽出する方法を示しています。
library (stringr)
#define string
some_string <- "Hey there my name is Doug"
#extract "ther" from string
str_extract(some_string, " ther ")
[1] “other”
パターン「ther」が文字列から正常に抽出されました。
文字列に存在しないパターンを抽出しようとすると、結果としてNA が返されるだけであることに注意してください。
library (stringr)
#define string
some_string <- "Hey there my name is Doug"
#attempt to extract "apple" from string
str_extract(some_string, " apple ")
[1] NA
パターン「apple」が文字列に存在しないため、 NA値が返されました。
例2: 文字列から数値を抽出する
次のコードは、正規表現\\d+を使用して文字列から数値のみを抽出する方法を示しています。
library (stringr)
#define string
some_string <- "There are 350 apples over there"
#extract only numeric values from string
str_extract(some_string, " \\d+ ")
[1] "350"
例 3: 文字列のベクトルから文字を抽出する
次のコードは、正規表現[az]+を使用して文字列のベクトルから文字のみを抽出する方法を示しています。
library (stringr)
#define vector of strings
some_strings <- c("4 apples", "3 bananas", "7 oranges")
#extract only characters from each string in vector
str_extract(some_strings, “ [az]+ ”)
[1] “apples” “bananas” “oranges”
各文字列の文字のみが返されることに注意してください。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。
R で str_replace を使用する方法
R で str_split を使用する方法
R で str_detect を使用する方法