Como usar str_split em r (com exemplos)


A função str_split() do pacote stringr em R pode ser usada para dividir uma string em vários pedaços. Esta função usa a seguinte sintaxe:

str_split(string, padrão)

Ouro:

  • string: vetor de caracteres
  • padrão: padrão no qual dividir

Da mesma forma, a função str_split_fixed() do pacote stringr pode ser usada para dividir uma string em um número fixo de pedaços. Esta função usa a seguinte sintaxe:

str_split_fixed(string, padrão, n)

Ouro:

  • string: vetor de caracteres
  • padrão: padrão no qual dividir
  • n: Número de peças a serem devolvidas

Este tutorial fornece exemplos de uso de cada uma dessas funções no seguinte quadro de dados:

 #create data frame
df <- data. frame (team=c('andy & bob', 'carl & doug', 'eric & frank'),
                 dots=c(14, 17, 19))

#view data frame
df

          team points
1 andy & bob 14
2 carl & doug 17
3 eric & frank 19

Exemplo 1: Dividir uma String Usando str_split()

O código a seguir mostra como dividir a string na coluna “team” usando a função str_split() :

 library (stringr)

#split the string in the team column on " & "
str_split(df$team, " & ")

[[1]]
[1] “andy” “bob” 

[[2]]
[1] “carl” “doug”

[[3]]
[1] “eric” “frank”

O resultado é uma lista de três itens que mostram os nomes dos jogadores individuais de cada equipe.

Exemplo 2: Dividir uma string usando str_split_fixed()

O código a seguir mostra como dividir a string na coluna “team” em duas partes fixas usando a função str_split_fixed() :

 library (stringr)

#split the string in the team column on " & "
str_split_fixed(df$team, " & ", 2)

     [,1] [,2]   
[1,] “andy” “bob”  
[2,] "carl" "doug" 
[3,] "eric" "frank"

O resultado é uma matriz com duas colunas e três linhas.

Uma aplicação útil da função str_split_fixed() é anexar a matriz resultante ao final do quadro de dados. Por exemplo:

 library (stringr)

#split the string in the team column and append resulting matrix to data frame
df[, 3:4] <- str_split_fixed(df$team, " & ", 2)

#view data frame
df
          team points V3 V4
1 andy & bob 14 andy bob
2 carl & doug 17 carl doug
3 eric & frank 19 eric frank

A coluna denominada “V3” exibe o nome do primeiro jogador da equipe e a coluna denominada “V4” exibe o nome do segundo jogador da equipe.

Recursos adicionais

Como usar str_replace em R
Como realizar correspondência parcial de strings em R
Como converter strings em datas em R
Como converter caractere em numérico em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *