R で文字列内の単語を数える方法 (例あり)


R で文字列内の単語数をカウントするために使用できる方法は 3 つあります。

方法 1: Base R を使用する

 lengths(strsplit(my_string, ' '))

方法 2: stringi パッケージを使用する

 library (stringi)

stri_count_words(my_string)

方法 3: stringr パッケージを使用する

 library (stringr)

str_count(my_string, ' \\w+ ')

これらの各メソッドは、 my_stringという文字列内の単語数を表す数値を返します。

次の例は、これらの各メソッドを実際に使用する方法を示しています。

例 1: 基数 R を使用して単語をカウントする

次のコードは、R の基本関数lengthstrsplitを使用して文字列内の単語数をカウントする方法を示しています。

 #create string
my_string <- 'this is a string with seven words'

#count number of words in string
lengths(strsplit(my_string, ' '))

[1] 7

結果から、文字列には 7 つの単語が含まれていることがわかります。

関連: R で strsplit() 関数を使用して文字列の要素を分割する方法

例 2: stringi パッケージを使用して単語をカウントする

次のコードは、R のstringiパッケージのstri_count_words関数を使用して文字列内の単語数をカウントする方法を示しています。

 library (stringi)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
stri_count_words(my_string)

[1] 7

結果から、文字列には 7 つの単語が含まれていることがわかります。

例 3: stringr パッケージを使用して単語をカウントする

次のコードは、R のstringrパッケージのstr_count関数を使用して文字列内の単語数をカウントする方法を示しています。

 library (stringr)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
str_count(my_string, ' \\w+ ')

[1] 7

結果から、文字列には 7 つの単語が含まれていることがわかります。

正規表現\\w+を使用して非単語文字と一致し、連続する 1 つ以上を示す+記号を使用していることに注意してください。

: これらの各例では、単一の文字列内の単語の数を数えましたが、各メソッドは文字列のベクトルでも機能します。

追加リソース

次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。

Rで文字列内の文字の位置を見つける方法
R の文字列から文字を削除する方法
Rで特定の文字列を含む列を選択する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です