A: come verificare se la colonna contiene una stringa


È possibile utilizzare i seguenti metodi per verificare se una colonna di un frame di dati in R contiene una stringa:

Metodo 1: controlla se la stringa esatta esiste nella colonna

 sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0

Metodo 2: controlla se esiste una stringa parziale nella colonna

 sum(str_detect(df$column_name, ' partial_string ')) > 0

Metodo 3: contare le occorrenze parziali di stringa nella colonna

 sum(str_detect(df$column_name, ' partial_string '))

Questo tutorial spiega come utilizzare ciascun metodo nella pratica con il seguente frame di dati:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conf=c('East', 'East', 'South', 'West', 'West', 'East'),
                 dots=c(11, 14, 15, 15, 14, 19))

#view data frame
df

  team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19

Esempio 1: controlla se esiste la stringa esatta nella colonna

Il codice seguente mostra come verificare se esiste la stringa esatta “Eas” nella colonna conf del frame di dati:

 #check if exact string 'Eas' exists in conf column
sum(str_detect(df$conf, ' ^Eas$ ')) > 0

[1] FALSE

L’output restituisce FALSE .

Questo ci dice che la stringa esatta ‘Eas’ non esiste nella colonna conf .

Nota : abbiamo utilizzato i simboli regex per indicare i caratteri iniziali ( ^ ) e finali ( $ ) della stringa che stavamo cercando.

Esempio 2: controlla se esiste una stringa parziale nella colonna

Il codice seguente mostra come verificare se la stringa parziale ‘Eas’ esiste nella colonna conf del frame di dati:

 #check if partial string 'Eas' exists in conf column
sum(str_detect(df$conf, ' Eas ')) > 0

[1] TRUE

L’output restituisce TRUE .

Questo ci dice che la stringa parziale ‘Eas’ esiste nella colonna conf del frame di dati.

Esempio 3: contare le occorrenze di una stringa parziale in una colonna

Il codice seguente mostra come contare il numero di volte in cui la stringa parziale “Eas” appare nella colonna conf del frame dati:

 #count occurrences of partial string 'Eas' in conf column
sum(str_detect(df$conf, ' Eas '))

[1] 3

L’output restituisce 3 .

Questo ci dice che la stringa parziale ‘Eas’ appare 3 volte nella colonna conf del data frame.

Correlati: come utilizzare la funzione str_detect() in R

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come selezionare colonne contenenti una stringa specifica in R
Come rimuovere caratteri da una stringa in R
Come trovare la posizione del carattere in una stringa in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *