Cara menggunakan fungsi substring di r (4 contoh)
Fungsi substring() di R dapat digunakan untuk mengekstrak substring dalam vektor karakter.
Fungsi ini menggunakan sintaks berikut:
substring(text, first, last)
Emas:
- teks: Nama vektor karakter
- pertama: Elemen pertama yang diekstraksi
- terakhir: Elemen terakhir yang diekstraksi
Perhatikan juga bahwa fungsi substr() melakukan hal yang persis sama, tetapi dengan nama argumen yang sedikit berbeda:
substr(text, first, last)
Emas:
- x : Nama vektor karakter
- start: Elemen pertama yang diekstraksi
- stop: Elemen terakhir yang diekstraksi
Contoh dalam tutorial ini menunjukkan cara menggunakan fungsi substring() dalam praktiknya dengan bingkai data berikut di R:
#create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))
#view data frame
df
team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies
Contoh 1: Ekstrak karakter di antara posisi tertentu
Kode berikut menunjukkan cara menggunakan fungsi substring() untuk mengekstrak karakter antara posisi 2 dan 5 kolom “tim”:
#create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )
#view updated data frame
df
team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies
Perhatikan bahwa kolom baru berisi karakter antara posisi 2 dan 5 kolom “tim”.
Contoh 2: Ekstrak N karakter pertama
Kode berikut menunjukkan cara menggunakan fungsi substring() untuk mengekstrak 3 karakter pertama dari kolom “tim”:
#create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )
#view updated data frame
df
team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray
Perhatikan bahwa kolom baru berisi tiga karakter pertama dari kolom “tim”.
Contoh 3: Ekstrak N karakter terakhir
Kode berikut menunjukkan cara menggunakan fungsi substring() untuk mengekstrak 3 karakter terakhir dari kolom “tim”:
#create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))
#view updated data frame
df
team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies
Perhatikan bahwa kolom baru berisi tiga karakter terakhir dari kolom “tim”.
Contoh 4: Ganti substring
Kode berikut menunjukkan cara menggunakan fungsi substring() untuk mengganti 3 karakter pertama dari nilai di kolom “tim” dengan 3 tanda bintang:
#replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "
#view updated data frame
df
team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies
Perhatikan bahwa tiga karakter pertama dari setiap nama tim telah diganti dengan tanda bintang.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya dengan string di R:
Cara menggunakan str_replace di R
Cara melakukan pencocokan string parsial di R
Cara mengonversi string menjadi tanggal di R
Cara mengubah karakter menjadi numerik di R