Comment compter les mots dans une chaîne dans R (avec exemples)
Il existe trois méthodes que vous pouvez utiliser pour compter le nombre de mots dans une chaîne dans R :
Méthode 1 : utiliser Base R
lengths(strsplit(my_string, ' '))
Méthode 2 : utiliser le package stringi
library(stringi)
stri_count_words(my_string)
Méthode 3 : utiliser le package stringr
library(stringr) str_count(my_string, '\\w+')
Chacune de ces méthodes renverra une valeur numérique qui représente le nombre de mots dans la chaîne appelée my_string .
Les exemples suivants montrent comment utiliser chacune de ces méthodes dans la pratique.
Exemple 1 : compter les mots en utilisant la base R
Le code suivant montre comment compter le nombre de mots dans une chaîne à l’aide des fonctions lengths et strsplit de la base R :
#create string my_string <- 'this is a string with seven words' #count number of words in string lengths(strsplit(my_string, ' ')) [1] 7
À partir du résultat, nous pouvons voir qu’il y a sept mots dans la chaîne.
Connexe : Comment utiliser la fonction strsplit() dans R pour diviser les éléments d’une chaîne
Exemple 2 : Compter les mots à l’aide du package stringi
Le code suivant montre comment compter le nombre de mots dans une chaîne à l’aide de la fonction stri_count_words du package stringi dans R :
library(stringi) #create string my_string <- 'this is a string with seven words' #count number of words in string stri_count_words(my_string) [1] 7
À partir du résultat, nous pouvons voir qu’il y a sept mots dans la chaîne.
Exemple 3 : Compter les mots à l’aide du package stringr
Le code suivant montre comment compter le nombre de mots dans une chaîne à l’aide de la fonction str_count du package stringr dans R :
library(stringr) #create string my_string <- 'this is a string with seven words' #count number of words in string str_count(my_string, '\\w+') [1] 7
À partir du résultat, nous pouvons voir qu’il y a sept mots dans la chaîne.
Notez que nous avons utilisé l’expression régulière \\w+ pour faire correspondre les caractères autres que des mots avec le signe + pour en indiquer un ou plusieurs à la suite.
Remarque : Dans chacun de ces exemples, nous avons compté le nombre de mots dans une seule chaîne, mais chaque méthode fonctionnera également avec un vecteur de chaînes.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment trouver l’emplacement du caractère dans une chaîne dans R
Comment supprimer des caractères d’une chaîne dans R
Comment sélectionner des colonnes contenant une chaîne spécifique dans R