Comment utiliser la fonction strsplit() dans R pour diviser des éléments de chaîne



La fonction strsplit() dans R peut être utilisée pour diviser une chaîne en plusieurs morceaux. Cette fonction utilise la syntaxe suivante :

strsplit(chaîne, motif)

où:

  • chaîne : vecteur de caractères
  • motif : motif sur lequel diviser

Les exemples suivants montrent comment utiliser cette fonction dans la pratique.

Exemple 1 : diviser une chaîne en fonction des espaces

Le code suivant montre comment utiliser la fonction strsplit() pour diviser une chaîne en fonction des espaces :

#split string based on spaces
split_up <- strsplit("Hey there people", split=" ")

#view results
split_up

[[1]]
[1] "Hey"    "there"  "people"

#view class of split_up
class(split_up)

[1] "list"

Le résultat est une liste de trois éléments divisés en fonction des espaces dans la chaîne d’origine.

Nous pouvons utiliser la fonction unlist() si nous souhaitons plutôt produire un vecteur comme résultat :

#split string based on spaces
split_up <- unlist(strsplit("Hey there people", split=" "))

#view results
split_up

[1] "Hey"    "there"  "people"

#view class of split_up
class(split_up)

[1] "character"

Nous pouvons voir que le résultat est un vecteur de caractères.

Exemple 2 : chaîne divisée en fonction d’un délimiteur personnalisé

Nous pouvons également utiliser la fonction strplit() pour diviser une chaîne en fonction d’un délimiteur personnalisé, tel qu’un tiret :

#split string based on dashes
strsplit("Hey-there-people", split="-")

[[1]]
[1] "Hey"    "there"  "people"

Le résultat est une liste de trois éléments divisés en fonction des tirets de la chaîne d’origine.

Exemple 3 : diviser une chaîne en fonction de plusieurs délimiteurs

Nous pouvons également utiliser des crochets dans l’argument split de la fonction strplit() pour diviser une chaîne en fonction de plusieurs délimiteurs différents :

#split string based on several delimiters
strsplit("Hey&there-you/people", split="[&-/]")

[[1]]
[1] "Hey"    "there"  "you"    "people"

Le résultat est une liste d’éléments qui ont été divisés chaque fois que l’un des délimiteurs suivants était présent dans la chaîne d’origine :

  • Esperluette ( & )
  • Tiret ( )
  • Barre oblique ( / )

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes avec des chaînes dans R :

Comment utiliser str_replace dans R
Comment effectuer une correspondance de chaîne partielle dans R
Comment convertir des chaînes en dates dans R
Comment convertir un caractère en numérique dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *