Como usar a função substring em r (4 exemplos)
A função substring() em R pode ser usada para extrair uma substring em um vetor de caracteres.
Esta função usa a seguinte sintaxe:
substring(text, first, last)
Ouro:
- texto: Nome do vetor de caracteres
- primeiro: O primeiro elemento a extrair
- last: O último elemento a ser extraído
Observe também que a função substr() faz exatamente a mesma coisa, mas com nomes de argumentos ligeiramente diferentes:
substr(text, first, last)
Ouro:
- x: nome do vetor de caracteres
- start: O primeiro elemento a extrair
- stop: O último elemento a ser extraído
Os exemplos neste tutorial mostram como usar a função substring() na prática com o seguinte quadro de dados em R:
#create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))
#view data frame
df
team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies
Exemplo 1: Extraia caracteres entre determinadas posições
O código a seguir mostra como usar a função substring() para extrair caracteres entre as posições 2 e 5 da coluna “team”:
#create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )
#view updated data frame
df
team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies
Observe que a nova coluna contém os caracteres entre as posições 2 e 5 da coluna “equipe”.
Exemplo 2: Extraia os primeiros N caracteres
O código a seguir mostra como usar a função substring() para extrair os 3 primeiros caracteres da coluna “equipe”:
#create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )
#view updated data frame
df
team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray
Observe que a nova coluna contém os três primeiros caracteres da coluna “equipe”.
Exemplo 3: Extraia os últimos N caracteres
O código a seguir mostra como usar a função substring() para extrair os últimos 3 caracteres da coluna “team”:
#create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))
#view updated data frame
df
team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies
Observe que a nova coluna contém os três últimos caracteres da coluna “equipe”.
Exemplo 4: Substitua uma substring
O código a seguir mostra como usar a função substring() para substituir os 3 primeiros caracteres dos valores na coluna “equipe” por 3 asteriscos:
#replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "
#view updated data frame
df
team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies
Observe que os três primeiros caracteres do nome de cada equipe foram substituídos por asteriscos.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns com strings em R:
Como usar str_replace em R
Como realizar correspondência parcial de strings em R
Como converter strings em datas em R
Como converter caractere em numérico em R