Comment extraire une chaîne avant l’espace dans R
Vous pouvez utiliser les méthodes suivantes pour extraire une chaîne avant un espace dans R :
Méthode 1 : extraire la chaîne avant l’espace à l’aide de Base R
gsub( " .*$", "", my_string)
Méthode 2 : extraire la chaîne avant l’espace à l’aide du package stringr
library(stringr)
word(my_string, 1)
Ces deux exemples extraient la chaîne avant le premier espace de la chaîne appelée my_string .
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le bloc de données suivant :
#create data frame
df <- data.frame(athlete=c('A', 'B', 'C', 'D'),
distance=c('23.2 miles', '14 miles', '5 miles', '9.3 miles'))
#view data frame
df
athlete distance
1 A 23.2 miles
2 B 14 miles
3 C 5 miles
4 D 9.3 miles
Exemple 1 : Extraire la chaîne avant l’espace à l’aide de Base R
Le code suivant montre comment extraire la chaîne avant l’espace dans chaque chaîne dans la colonne distance du bloc de données :
#create new column that extracts string before space in distance column df$distance_amount <- gsub( " .*$", "", df$distance) #view updated data frame df athlete distance distance_amount 1 A 23.2 miles 23.2 2 B 14 miles 14 3 C 5 miles 5 4 D 9.3 miles 9.3
Notez que la nouvelle colonne appelée distance_amount contient la chaîne avant l’espace dans les chaînes de la colonne distance du bloc de données.
Connexe : Une introduction à gsub() dans R
Exemple 2 : Extraire la chaîne avant l’espace à l’aide du package stringr
Le code suivant montre comment extraire la chaîne avant l’espace dans chaque chaîne dans la colonne distance du bloc de données en utilisant la fonction word() du package stringr dans R :
library(stringr) #create new column that extracts string before space in distance column df$distance_amount <- word(df$distance, 1) #view updated data frame df athlete distance distance_amount 1 A 23.2 miles 23.2 2 B 14 miles 14 3 C 5 miles 5 4 D 9.3 miles 9.3
Notez que la nouvelle colonne appelée distance_amount contient la chaîne avant l’espace dans les chaînes de la colonne distance du bloc de données.
Cela correspond aux résultats de l’utilisation de la fonction gsub() en base R.
Notez que la fonction word() du package stringr extrait les mots d’une chaîne donnée.
En fournissant la valeur 1 à cette fonction, nous pouvons extraire le premier mot trouvé dans une chaîne, ce qui équivaut à extraire la chaîne avant le premier espace.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment extraire une chaîne après un caractère spécifique dans R
Comment extraire une chaîne entre des caractères spécifiques dans R
Comment supprimer des caractères d’une chaîne dans R
Comment trouver l’emplacement du caractère dans une chaîne dans R