Cara mengekstrak string setelah karakter tertentu di r


Anda dapat menggunakan metode berikut untuk mengekstrak string setelah karakter tertentu di R:

Metode 1: Ekstrak string setelah karakter tertentu menggunakan Base R

 sub(' .*the ', '', my_string)

Metode 2: Ekstrak string setelah karakter tertentu menggunakan stringr

 library (stringr)

str_replace(my_string, ' (.*?)the(.*?) ', ' \\1 ')

Kedua contoh ini mengekstrak string setelah pola “the” di my_string .

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:

 #create data frame
df <- data. frame (team=c('theMavs', 'theHeat', 'theNets', 'theRockets'),
                 dots=c(114, 135, 119, 140))

#view data frame
df

        team points
1 theMavs 114
2 theHeat 135
3 theNets 119
4 theRockets 140

Contoh 1: Ekstrak string setelah karakter tertentu menggunakan Base R

Kode berikut menunjukkan cara mengekstrak string setelah “the” untuk setiap baris di kolom tim bingkai data:

 #create new column that extracts string after "the" in team column
df$team_name <- sub(' .*the ', '', df$team)

#view updated data frame
df

        team points team_name
1 theMavs 114 Mavs
2 theHeat 135 Heat
3 theNets 119 Nets
4 theRockets 140 Rockets

Perhatikan bahwa kolom baru bernama nama_tim berisi string setelah “the” untuk setiap baris di kolom tim dalam bingkai data.

Terkait : Pengantar sub() di R

Contoh 2: Ekstrak string setelah karakter tertentu menggunakan paket stringr

Kode berikut menunjukkan cara mengekstrak string setelah “the” untuk setiap baris di kolom tim bingkai data menggunakan fungsi str_replace() dari paket stringr di R:

 library (stringr)

#create new column that extracts string after "the" in team column
df$team_name <- str_replace(df$team, ' (.*?)the(.*?)', '\\1 ')

#view updated data frame
df

           team points team_name
1 Mavs pro team 114 Mavs
2 team Heat pro 135 Heat
3 Nets pro team 119 Nets

Perhatikan bahwa kolom baru bernama nama_tim berisi string setelah “the” untuk setiap baris di kolom tim dalam bingkai data.

Ini cocok dengan hasil penggunaan fungsi sub() di basis R.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara memilih kolom yang berisi string tertentu di R
Cara menghapus karakter dari string di R
Cara menemukan lokasi karakter dalam string di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *