Como usar a função substring em r (4 exemplos)


A função substring() em R pode ser usada para extrair uma substring em um vetor de caracteres.

Esta função usa a seguinte sintaxe:

 substring(text, first, last)

Ouro:

  • texto: Nome do vetor de caracteres
  • primeiro: O primeiro elemento a extrair
  • last: O último elemento a ser extraído

Observe também que a função substr() faz exatamente a mesma coisa, mas com nomes de argumentos ligeiramente diferentes:

 substr(text, first, last)

Ouro:

  • x: nome do vetor de caracteres
  • start: O primeiro elemento a extrair
  • stop: O último elemento a ser extraído

Os exemplos neste tutorial mostram como usar a função substring() na prática com o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

Exemplo 1: Extraia caracteres entre determinadas posições

O código a seguir mostra como usar a função substring() para extrair caracteres entre as posições 2 e 5 da coluna “team”:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

Observe que a nova coluna contém os caracteres entre as posições 2 e 5 da coluna “equipe”.

Exemplo 2: Extraia os primeiros N caracteres

O código a seguir mostra como usar a função substring() para extrair os 3 primeiros caracteres da coluna “equipe”:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

Observe que a nova coluna contém os três primeiros caracteres da coluna “equipe”.

Exemplo 3: Extraia os últimos N caracteres

O código a seguir mostra como usar a função substring() para extrair os últimos 3 caracteres da coluna “team”:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

Observe que a nova coluna contém os três últimos caracteres da coluna “equipe”.

Exemplo 4: Substitua uma substring

O código a seguir mostra como usar a função substring() para substituir os 3 primeiros caracteres dos valores na coluna “equipe” por 3 asteriscos:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

Observe que os três primeiros caracteres do nome de cada equipe foram substituídos por asteriscos.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns com strings em R:

Como usar str_replace em R
Como realizar correspondência parcial de strings em R
Como converter strings em datas em R
Como converter caractere em numérico em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *