R'de str_split nasıl kullanılır (örneklerle)


R’deki stringr paketinin str_split() işlevi, bir dizeyi birden çok parçaya bölmek için kullanılabilir. Bu işlev aşağıdaki sözdizimini kullanır:

str_split(dize, desen)

Altın:

  • dize: karakter vektörü
  • desen: bölünecek desen

Benzer şekilde, stringr paketindeki str_split_fixed() işlevi, bir dizeyi sabit sayıda parçaya bölmek için kullanılabilir. Bu işlev aşağıdaki sözdizimini kullanır:

str_split_fixed(dize, desen, n)

Altın:

  • dize: karakter vektörü
  • desen: bölünecek desen
  • n: İade edilecek parça sayısı

Bu eğitimde, bu işlevlerin her birinin aşağıdaki veri çerçevesinde kullanılmasına ilişkin örnekler verilmektedir:

 #create data frame
df <- data. frame (team=c('andy & bob', 'carl & doug', 'eric & frank'),
                 dots=c(14, 17, 19))

#view data frame
df

          team points
1 andy & bob 14
2 carl & doug 17
3 eric & frank 19

Örnek 1: str_split() Kullanarak Bir Dizeyi Bölme

Aşağıdaki kod, str_split() işlevini kullanarak “ekip” sütunundaki dizenin nasıl bölüneceğini gösterir:

 library (stringr)

#split the string in the team column on " & "
str_split(df$team, " & ")

[[1]]
[1] “andy” “bob” 

[[2]]
[1] “carl” “doug”

[[3]]
[1] “eric” “frank”

Sonuç, her takımdaki bireysel oyuncuların adlarını gösteren üç öğeden oluşan bir listedir.

Örnek 2: str_split_fixed() Kullanarak Bir Dizeyi Bölme

Aşağıdaki kod, str_split_fixed() işlevini kullanarak “ekip” sütunundaki dizenin iki sabit parçaya nasıl bölüneceğini gösterir:

 library (stringr)

#split the string in the team column on " & "
str_split_fixed(df$team, " & ", 2)

     [,1] [,2]   
[1,] “andy” “bob”  
[2,] "carl" "doug" 
[3,] "eric" "frank"

Sonuç, iki sütun ve üç satırdan oluşan bir matristir.

str_split_fixed() fonksiyonunun yararlı bir uygulaması, elde edilen matrisi veri çerçevesinin sonuna eklemektir. Örneğin:

 library (stringr)

#split the string in the team column and append resulting matrix to data frame
df[, 3:4] <- str_split_fixed(df$team, " & ", 2)

#view data frame
df
          team points V3 V4
1 andy & bob 14 andy bob
2 carl & doug 17 carl doug
3 eric & frank 19 eric frank

“V3” etiketli sütun ilk takım oyuncusunun adını, “V4” etiketli sütun ise ikinci takım oyuncusunun adını görüntüler.

Ek kaynaklar

R’de str_replace nasıl kullanılır?
R’de kısmi dize eşleştirmesi nasıl gerçekleştirilir?
Dizeleri R’deki tarihlere dönüştürme
R’de karakter sayısala nasıl dönüştürülür

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir