Comment extraire une chaîne avant l’espace dans R



Vous pouvez utiliser les méthodes suivantes pour extraire une chaîne avant un espace dans R :

Méthode 1 : extraire la chaîne avant l’espace à l’aide de Base R

gsub( " .*$", "", my_string)

Méthode 2 : extraire la chaîne avant l’espace à l’aide du package stringr

library(stringr)

word(my_string, 1)

Ces deux exemples extraient la chaîne avant le premier espace de la chaîne appelée my_string .

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le bloc de données suivant :

#create data frame
df <- data.frame(athlete=c('A', 'B', 'C', 'D'),
                 distance=c('23.2 miles', '14 miles', '5 miles', '9.3 miles'))

#view data frame
df

  athlete   distance
1       A 23.2 miles
2       B   14 miles
3       C    5 miles
4       D  9.3 miles

Exemple 1 : Extraire la chaîne avant l’espace à l’aide de Base R

Le code suivant montre comment extraire la chaîne avant l’espace dans chaque chaîne dans la colonne distance du bloc de données :

#create new column that extracts string before space in distance column
df$distance_amount <- gsub( " .*$", "", df$distance) 

#view updated data frame
df

  athlete   distance distance_amount
1       A 23.2 miles            23.2
2       B   14 miles              14
3       C    5 miles               5
4       D  9.3 miles             9.3

Notez que la nouvelle colonne appelée distance_amount contient la chaîne avant l’espace dans les chaînes de la colonne distance du bloc de données.

Connexe : Une introduction à gsub() dans R

Exemple 2 : Extraire la chaîne avant l’espace à l’aide du package stringr

Le code suivant montre comment extraire la chaîne avant l’espace dans chaque chaîne dans la colonne distance du bloc de données en utilisant la fonction word() du package stringr dans R :

library(stringr)

#create new column that extracts string before space in distance column
df$distance_amount <- word(df$distance, 1)

#view updated data frame
df

  athlete   distance distance_amount
1       A 23.2 miles            23.2
2       B   14 miles              14
3       C    5 miles               5
4       D  9.3 miles             9.3

Notez que la nouvelle colonne appelée distance_amount contient la chaîne avant l’espace dans les chaînes de la colonne distance du bloc de données.

Cela correspond aux résultats de l’utilisation de la fonction gsub() en base R.

Notez que la fonction word() du package stringr extrait les mots d’une chaîne donnée.

En fournissant la valeur 1 à cette fonction, nous pouvons extraire le premier mot trouvé dans une chaîne, ce qui équivaut à extraire la chaîne avant le premier espace.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment extraire une chaîne après un caractère spécifique dans R
Comment extraire une chaîne entre des caractères spécifiques dans R
Comment supprimer des caractères d’une chaîne dans R
Comment trouver l’emplacement du caractère dans une chaîne dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *