Cara menggunakan str_split di r (dengan contoh)


Fungsi str_split() dari paket stringr di R dapat digunakan untuk membagi string menjadi beberapa bagian. Fungsi ini menggunakan sintaks berikut:

str_split(string, pola)

Emas:

  • string: vektor karakter
  • pola: pola untuk membagi

Demikian pula, fungsi str_split_fixed() dari paket stringr dapat digunakan untuk membagi string menjadi sejumlah potongan yang tetap. Fungsi ini menggunakan sintaks berikut:

str_split_fixed(string, pola, n)

Emas:

  • string: vektor karakter
  • pola: pola untuk membagi
  • n: Jumlah potongan yang akan dikembalikan

Tutorial ini memberikan contoh penggunaan masing-masing fungsi tersebut pada bingkai data berikut:

 #create data frame
df <- data. frame (team=c('andy & bob', 'carl & doug', 'eric & frank'),
                 dots=c(14, 17, 19))

#view data frame
df

          team points
1 andy & bob 14
2 carl & doug 17
3 eric & frank 19

Contoh 1: Pisahkan String Menggunakan str_split()

Kode berikut menunjukkan cara membagi string di kolom “tim” menggunakan fungsi str_split() :

 library (stringr)

#split the string in the team column on " & "
str_split(df$team, " & ")

[[1]]
[1] “andy” “bob” 

[[2]]
[1] “carl” “doug”

[[3]]
[1] “eric” “frank”

Hasilnya adalah daftar tiga item yang menunjukkan nama masing-masing pemain di setiap tim.

Contoh 2: Pisahkan String Menggunakan str_split_fixed()

Kode berikut menunjukkan cara membagi string di kolom “tim” menjadi dua bagian tetap menggunakan fungsi str_split_fixed() :

 library (stringr)

#split the string in the team column on " & "
str_split_fixed(df$team, " & ", 2)

     [,1] [,2]   
[1,] “andy” “bob”  
[2,] "carl" "doug" 
[3,] "eric" "frank"

Hasilnya adalah matriks dengan dua kolom dan tiga baris.

Penerapan fungsi str_split_fixed() yang berguna adalah menambahkan matriks yang dihasilkan ke akhir bingkai data. Misalnya:

 library (stringr)

#split the string in the team column and append resulting matrix to data frame
df[, 3:4] <- str_split_fixed(df$team, " & ", 2)

#view data frame
df
          team points V3 V4
1 andy & bob 14 andy bob
2 carl & doug 17 carl doug
3 eric & frank 19 eric frank

Kolom berlabel “V3” menampilkan nama pemain tim pertama dan kolom berlabel “V4” menampilkan nama pemain tim kedua.

Sumber daya tambahan

Cara menggunakan str_replace di R
Cara melakukan pencocokan string parsial di R
Cara mengonversi string menjadi tanggal di R
Cara mengubah karakter menjadi numerik di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *