Como extrair uma string após um caractere específico em r


Você pode usar os seguintes métodos para extrair uma string após um caractere específico em R:

Método 1: Extraia string após caracteres específicos usando Base R

 sub(' .*the ', '', my_string)

Método 2: extrair string após caracteres específicos usando stringr

 library (stringr)

str_replace(my_string, ' (.*?)the(.*?) ', ' \\1 ')

Ambos os exemplos extraem a string após o padrão “the” em my_string .

Os exemplos a seguir mostram como usar cada método na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (team=c('theMavs', 'theHeat', 'theNets', 'theRockets'),
                 dots=c(114, 135, 119, 140))

#view data frame
df

        team points
1 theMavs 114
2 theHeat 135
3 theNets 119
4 theRockets 140

Exemplo 1: Extraia uma string após caracteres específicos usando Base R

O código a seguir mostra como extrair a string após “the” para cada linha na coluna da equipe do quadro de dados:

 #create new column that extracts string after "the" in team column
df$team_name <- sub(' .*the ', '', df$team)

#view updated data frame
df

        team points team_name
1 theMavs 114 Mavs
2 theHeat 135 Heat
3 theNets 119 Nets
4 theRockets 140 Rockets

Observe que a nova coluna chamada team_name contém a string após “the” para cada linha na coluna da equipe no quadro de dados.

Relacionado : Uma introdução ao sub() em R

Exemplo 2: Extraia uma string após caracteres específicos usando o pacote stringr

O código a seguir mostra como extrair a string após “the” para cada linha na coluna team do quadro de dados usando a função str_replace() do pacote stringr em R:

 library (stringr)

#create new column that extracts string after "the" in team column
df$team_name <- str_replace(df$team, ' (.*?)the(.*?)', '\\1 ')

#view updated data frame
df

           team points team_name
1 Mavs pro team 114 Mavs
2 team Heat pro 135 Heat
3 Nets pro team 119 Nets

Observe que a nova coluna chamada team_name contém a string após “the” para cada linha na coluna da equipe no quadro de dados.

Isso corresponde aos resultados do uso da função sub() na base R.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como selecionar colunas contendo uma string específica em R
Como remover caracteres de uma string em R
Como encontrar a localização dos caracteres em uma string em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *