R で文字列内の単語を数える方法 (例あり)
R で文字列内の単語数をカウントするために使用できる方法は 3 つあります。
方法 1: Base R を使用する
lengths(strsplit(my_string, ' '))
方法 2: stringi パッケージを使用する
library (stringi)
stri_count_words(my_string)
方法 3: stringr パッケージを使用する
library (stringr) str_count(my_string, ' \\w+ ')
これらの各メソッドは、 my_stringという文字列内の単語数を表す数値を返します。
次の例は、これらの各メソッドを実際に使用する方法を示しています。
例 1: 基数 R を使用して単語をカウントする
次のコードは、R の基本関数lengthとstrsplitを使用して文字列内の単語数をカウントする方法を示しています。
#create string my_string <- 'this is a string with seven words' #count number of words in string lengths(strsplit(my_string, ' ')) [1] 7
結果から、文字列には 7 つの単語が含まれていることがわかります。
関連: R で strsplit() 関数を使用して文字列の要素を分割する方法
例 2: stringi パッケージを使用して単語をカウントする
次のコードは、R のstringiパッケージのstri_count_words関数を使用して文字列内の単語数をカウントする方法を示しています。
library (stringi) #create string my_string <- 'this is a string with seven words' #count number of words in string stri_count_words(my_string) [1] 7
結果から、文字列には 7 つの単語が含まれていることがわかります。
例 3: stringr パッケージを使用して単語をカウントする
次のコードは、R のstringrパッケージのstr_count関数を使用して文字列内の単語数をカウントする方法を示しています。
library (stringr) #create string my_string <- 'this is a string with seven words' #count number of words in string str_count(my_string, ' \\w+ ') [1] 7
結果から、文字列には 7 つの単語が含まれていることがわかります。
正規表現\\w+を使用して非単語文字と一致し、連続する 1 つ以上を示す+記号を使用していることに注意してください。
注: これらの各例では、単一の文字列内の単語の数を数えましたが、各メソッドは文字列のベクトルでも機能します。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。