Comment compter les mots dans une chaîne dans R (avec exemples)



Il existe trois méthodes que vous pouvez utiliser pour compter le nombre de mots dans une chaîne dans R :

Méthode 1 : utiliser Base R

lengths(strsplit(my_string, ' '))

Méthode 2 : utiliser le package stringi

library(stringi)

stri_count_words(my_string)

Méthode 3 : utiliser le package stringr

library(stringr)

str_count(my_string, '\\w+')

Chacune de ces méthodes renverra une valeur numérique qui représente le nombre de mots dans la chaîne appelée my_string .

Les exemples suivants montrent comment utiliser chacune de ces méthodes dans la pratique.

Exemple 1 : compter les mots en utilisant la base R

Le code suivant montre comment compter le nombre de mots dans une chaîne à l’aide des fonctions lengths et strsplit de la base R :

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
lengths(strsplit(my_string, ' '))

[1] 7

À partir du résultat, nous pouvons voir qu’il y a sept mots dans la chaîne.

Connexe : Comment utiliser la fonction strsplit() dans R pour diviser les éléments d’une chaîne

Exemple 2 : Compter les mots à l’aide du package stringi

Le code suivant montre comment compter le nombre de mots dans une chaîne à l’aide de la fonction stri_count_words du package stringi dans R :

library(stringi) 

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
stri_count_words(my_string)

[1] 7

À partir du résultat, nous pouvons voir qu’il y a sept mots dans la chaîne.

Exemple 3 : Compter les mots à l’aide du package stringr

Le code suivant montre comment compter le nombre de mots dans une chaîne à l’aide de la fonction str_count du package stringr dans R :

library(stringr) 

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
str_count(my_string, '\\w+')

[1] 7

À partir du résultat, nous pouvons voir qu’il y a sept mots dans la chaîne.

Notez que nous avons utilisé l’expression régulière \\w+ pour faire correspondre les caractères autres que des mots avec le signe + pour en indiquer un ou plusieurs à la suite.

Remarque : Dans chacun de ces exemples, nous avons compté le nombre de mots dans une seule chaîne, mais chaque méthode fonctionnera également avec un vecteur de chaînes.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment trouver l’emplacement du caractère dans une chaîne dans R
Comment supprimer des caractères d’une chaîne dans R
Comment sélectionner des colonnes contenant une chaîne spécifique dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *