R : Comment vérifier si la colonne contient une chaîne



Vous pouvez utiliser les méthodes suivantes pour vérifier si une colonne d’un bloc de données dans R contient une chaîne :

Méthode 1 : vérifier si la chaîne exacte existe dans la colonne

sum(str_detect(df$column_name, '^exact_string$')) > 0

Méthode 2 : vérifier si une chaîne partielle existe dans la colonne

sum(str_detect(df$column_name, 'partial_string')) > 0

Méthode 3 : compter les occurrences de chaîne partielle dans la colonne

sum(str_detect(df$column_name, 'partial_string'))

Ce tutoriel explique comment utiliser chaque méthode en pratique avec le bloc de données suivant :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conf=c('East', 'East', 'South', 'West', 'West', 'East'),
                 points=c(11, 14, 15, 15, 14, 19))

#view data frame
df

  team  conf points
1    A  East     11
2    A  East     14
3    A South     15
4    B  West     15
5    B  West     14
6    C  East     19

Exemple 1 : Vérifier si la chaîne exacte existe dans la colonne

Le code suivant montre comment vérifier si la chaîne exacte « Eas » existe dans la colonne conf du bloc de données :

#check if exact string 'Eas' exists in conf column
sum(str_detect(df$conf, '^Eas$')) > 0

[1] FALSE

La sortie renvoie FALSE .

Cela nous indique que la chaîne exacte ‘Eas’ n’existe pas dans la colonne conf .

Remarque : Nous avons utilisé des symboles regex pour indiquer les caractères de début ( ^ ) et de fin ( $ ) de la chaîne que nous recherchions.

Exemple 2 : Vérifier si une chaîne partielle existe dans la colonne

Le code suivant montre comment vérifier si la chaîne partielle ‘Eas’ existe dans la colonne conf du bloc de données :

#check if partial string 'Eas' exists in conf column
sum(str_detect(df$conf, 'Eas')) > 0

[1] TRUE

La sortie renvoie TRUE .

Cela nous indique que la chaîne partielle ‘Eas’ existe dans la colonne conf du bloc de données.

Exemple 3 : compter les occurrences d’une chaîne partielle dans une colonne

Le code suivant montre comment compter le nombre de fois où la chaîne partielle « Eas » apparaît dans la colonne conf du bloc de données :

#count occurrences of partial string 'Eas' in conf column
sum(str_detect(df$conf, 'Eas'))

[1] 3

La sortie renvoie 3 .

Cela nous indique que la chaîne partielle ‘Eas’ apparaît 3 fois dans la colonne conf du bloc de données.

Connexe : Comment utiliser la fonction str_detect() dans R

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment sélectionner des colonnes contenant une chaîne spécifique dans R
Comment supprimer des caractères d’une chaîne dans R
Comment trouver l’emplacement du caractère dans une chaîne dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *