如何计算 r 中字符串中的单词数(附示例)
您可以使用三种方法来计算 R 中字符串中的单词数:
方法一:使用Base R
lengths(strsplit(my_string, ' '))
方法2:使用stringi包
library (stringi)
stri_count_words(my_string)
方法3:使用stringr包
library (stringr) str_count(my_string, ' \\w+ ')
这些方法中的每一个都会返回一个数值,表示名为my_string的字符串中的单词数。
以下示例展示了如何在实践中使用每种方法。
示例 1:使用基数 R 计算单词数
以下代码演示如何使用 R 基本函数lengths和strsplit计算字符串中的单词数:
#create string my_string <- 'this is a string with seven words' #count number of words in string lengths(strsplit(my_string, ' ')) [1] 7
从结果中我们可以看到字符串中有七个单词。
相关:如何使用 R 中的 strsplit() 函数拆分字符串的元素
示例 2:使用 stringi 包计算单词数
以下代码显示如何使用 R 中stringi包中的stri_count_words函数计算字符串中的单词数:
library (stringi) #create string my_string <- 'this is a string with seven words' #count number of words in string stri_count_words(my_string) [1] 7
从结果中我们可以看到字符串中有七个单词。
示例 3:使用 stringr 包计算单词数
以下代码显示如何使用 R 中stringr包中的str_count函数计算字符串中的单词数:
library (stringr) #create string my_string <- 'this is a string with seven words' #count number of words in string str_count(my_string, ' \\w+ ') [1] 7
从结果中我们可以看到字符串中有七个单词。
请注意,我们使用正则表达式\\w+来匹配非单词字符,其中+号表示一行中的一个或多个。
注意:在每个示例中,我们都计算了单个字符串中的单词数,但每种方法也适用于字符串向量。
其他资源
以下教程解释了如何在 R 中执行其他常见任务: