Como usar str_split em r (com exemplos)
A função str_split() do pacote stringr em R pode ser usada para dividir uma string em vários pedaços. Esta função usa a seguinte sintaxe:
str_split(string, padrão)
Ouro:
- string: vetor de caracteres
- padrão: padrão no qual dividir
Da mesma forma, a função str_split_fixed() do pacote stringr pode ser usada para dividir uma string em um número fixo de pedaços. Esta função usa a seguinte sintaxe:
str_split_fixed(string, padrão, n)
Ouro:
- string: vetor de caracteres
- padrão: padrão no qual dividir
- n: Número de peças a serem devolvidas
Este tutorial fornece exemplos de uso de cada uma dessas funções no seguinte quadro de dados:
#create data frame df <- data. frame (team=c('andy & bob', 'carl & doug', 'eric & frank'), dots=c(14, 17, 19)) #view data frame df team points 1 andy & bob 14 2 carl & doug 17 3 eric & frank 19
Exemplo 1: Dividir uma String Usando str_split()
O código a seguir mostra como dividir a string na coluna “team” usando a função str_split() :
library (stringr) #split the string in the team column on " & " str_split(df$team, " & ") [[1]] [1] “andy” “bob” [[2]] [1] “carl” “doug” [[3]] [1] “eric” “frank”
O resultado é uma lista de três itens que mostram os nomes dos jogadores individuais de cada equipe.
Exemplo 2: Dividir uma string usando str_split_fixed()
O código a seguir mostra como dividir a string na coluna “team” em duas partes fixas usando a função str_split_fixed() :
library (stringr)
#split the string in the team column on " & "
str_split_fixed(df$team, " & ", 2)
[,1] [,2]
[1,] “andy” “bob”
[2,] "carl" "doug"
[3,] "eric" "frank"
O resultado é uma matriz com duas colunas e três linhas.
Uma aplicação útil da função str_split_fixed() é anexar a matriz resultante ao final do quadro de dados. Por exemplo:
library (stringr)
#split the string in the team column and append resulting matrix to data frame
df[, 3:4] <- str_split_fixed(df$team, " & ", 2)
#view data frame
df
team points V3 V4
1 andy & bob 14 andy bob
2 carl & doug 17 carl doug
3 eric & frank 19 eric frank
A coluna denominada “V3” exibe o nome do primeiro jogador da equipe e a coluna denominada “V4” exibe o nome do segundo jogador da equipe.
Recursos adicionais
Como usar str_replace em R
Como realizar correspondência parcial de strings em R
Como converter strings em datas em R
Como converter caractere em numérico em R