Cara menggunakan fungsi substring di r (4 contoh)


Fungsi substring() di R dapat digunakan untuk mengekstrak substring dalam vektor karakter.

Fungsi ini menggunakan sintaks berikut:

 substring(text, first, last)

Emas:

  • teks: Nama vektor karakter
  • pertama: Elemen pertama yang diekstraksi
  • terakhir: Elemen terakhir yang diekstraksi

Perhatikan juga bahwa fungsi substr() melakukan hal yang persis sama, tetapi dengan nama argumen yang sedikit berbeda:

 substr(text, first, last)

Emas:

  • x : Nama vektor karakter
  • start: Elemen pertama yang diekstraksi
  • stop: Elemen terakhir yang diekstraksi

Contoh dalam tutorial ini menunjukkan cara menggunakan fungsi substring() dalam praktiknya dengan bingkai data berikut di R:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

Contoh 1: Ekstrak karakter di antara posisi tertentu

Kode berikut menunjukkan cara menggunakan fungsi substring() untuk mengekstrak karakter antara posisi 2 dan 5 kolom “tim”:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

Perhatikan bahwa kolom baru berisi karakter antara posisi 2 dan 5 kolom “tim”.

Contoh 2: Ekstrak N karakter pertama

Kode berikut menunjukkan cara menggunakan fungsi substring() untuk mengekstrak 3 karakter pertama dari kolom “tim”:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

Perhatikan bahwa kolom baru berisi tiga karakter pertama dari kolom “tim”.

Contoh 3: Ekstrak N karakter terakhir

Kode berikut menunjukkan cara menggunakan fungsi substring() untuk mengekstrak 3 karakter terakhir dari kolom “tim”:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

Perhatikan bahwa kolom baru berisi tiga karakter terakhir dari kolom “tim”.

Contoh 4: Ganti substring

Kode berikut menunjukkan cara menggunakan fungsi substring() untuk mengganti 3 karakter pertama dari nilai di kolom “tim” dengan 3 tanda bintang:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

Perhatikan bahwa tiga karakter pertama dari setiap nama tim telah diganti dengan tanda bintang.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya dengan string di R:

Cara menggunakan str_replace di R
Cara melakukan pencocokan string parsial di R
Cara mengonversi string menjadi tanggal di R
Cara mengubah karakter menjadi numerik di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *