R : Comment vérifier si la colonne contient une chaîne
Vous pouvez utiliser les méthodes suivantes pour vérifier si une colonne d’un bloc de données dans R contient une chaîne :
Méthode 1 : vérifier si la chaîne exacte existe dans la colonne
sum(str_detect(df$column_name, '^exact_string$')) > 0
Méthode 2 : vérifier si une chaîne partielle existe dans la colonne
sum(str_detect(df$column_name, 'partial_string')) > 0
Méthode 3 : compter les occurrences de chaîne partielle dans la colonne
sum(str_detect(df$column_name, 'partial_string'))
Ce tutoriel explique comment utiliser chaque méthode en pratique avec le bloc de données suivant :
#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'C'),
conf=c('East', 'East', 'South', 'West', 'West', 'East'),
points=c(11, 14, 15, 15, 14, 19))
#view data frame
df
team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6 C East 19
Exemple 1 : Vérifier si la chaîne exacte existe dans la colonne
Le code suivant montre comment vérifier si la chaîne exacte « Eas » existe dans la colonne conf du bloc de données :
#check if exact string 'Eas' exists in conf column sum(str_detect(df$conf, '^Eas$')) > 0 [1] FALSE
La sortie renvoie FALSE .
Cela nous indique que la chaîne exacte ‘Eas’ n’existe pas dans la colonne conf .
Remarque : Nous avons utilisé des symboles regex pour indiquer les caractères de début ( ^ ) et de fin ( $ ) de la chaîne que nous recherchions.
Exemple 2 : Vérifier si une chaîne partielle existe dans la colonne
Le code suivant montre comment vérifier si la chaîne partielle ‘Eas’ existe dans la colonne conf du bloc de données :
#check if partial string 'Eas' exists in conf column sum(str_detect(df$conf, 'Eas')) > 0 [1] TRUE
La sortie renvoie TRUE .
Cela nous indique que la chaîne partielle ‘Eas’ existe dans la colonne conf du bloc de données.
Exemple 3 : compter les occurrences d’une chaîne partielle dans une colonne
Le code suivant montre comment compter le nombre de fois où la chaîne partielle « Eas » apparaît dans la colonne conf du bloc de données :
#count occurrences of partial string 'Eas' in conf column sum(str_detect(df$conf, 'Eas')) [1] 3
La sortie renvoie 3 .
Cela nous indique que la chaîne partielle ‘Eas’ apparaît 3 fois dans la colonne conf du bloc de données.
Connexe : Comment utiliser la fonction str_detect() dans R
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment sélectionner des colonnes contenant une chaîne spécifique dans R
Comment supprimer des caractères d’une chaîne dans R
Comment trouver l’emplacement du caractère dans une chaîne dans R