R: dizenin sonundan alt dizeyi çıkar


Dizenin sonundan başlayarak R’de bir alt dizeyi çıkarmak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Base R’yi kullanın

 #define function to extract n characters starting from end
substr_end <- function (x, n){
  substr(x, nchar(x)-n+ 1 , nchar(x))
}

#extract 3 characters starting from end
substr_end(my_string, 3 )

Yöntem 2: stringr paketini kullanın

 library (stringr)

#extract 3 characters starting from end 
str_sub(my_string, start = - 3 )

Bu iki örnek, my_string adlı dizeden son üç karakteri çıkarıyor.

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Lakers', 'Hawks', 'Nets', 'Warriors'),
                 dots=c(100, 143, 129, 113, 123))

#view data frame
df

       team points
1 Mavericks 100
2 Lakers 143
3 Hawks 129
4 Nets 113
5 Warriors 123

Örnek 1: Base R’yi kullanarak alt dizeyi sondan çıkarın

Aşağıdaki kod, R tabanında özel bir işlevin nasıl tanımlanacağını ve ardından ekip sütunundaki her dizeden son üç karakteri çıkarmak için işlevin nasıl kullanılacağını gösterir:

 #define function to extract n characters starting from end
substr_end <- function (x, n){
  substr(x, nchar(x)-n+ 1 , nchar(x))
}

#create new column that extracts last 3 characters from team column
df$team_last3 <- substr_end(my_string, 3 )

#view updated data frame
df

       team points team_last3
1 Mavericks 100 cks
2 Lakers 143ers
3 Hawks 129 wks
4 Nets 113 ets
5 Warriors 123 gold

Team_last3 adlı yeni sütunun, veri çerçevesinin ekip sütunundaki her dizenin son üç karakterini içerdiğini unutmayın.

Örnek 2: Stringr paketini kullanarak alt dizeyi sondan çıkarın

Aşağıdaki kod, takım sütunundaki her dizeden son üç karakteri çıkarmak için R’deki stringr paketindeki str_sub() işlevinin nasıl kullanılacağını gösterir:

 library (stringr)

#create new column that extracts last 3 characters from team column
df$team_last3 <- str_sub(df$team, start = - 3 )

#view updated data frame
df

       team points team_last3
1 Mavericks 100 cks
2 Lakers 143ers
3 Hawks 129 wks
4 Nets 113 ets
5 Warriors 123 gold

Team_last3 adlı yeni sütunun, veri çerçevesinin ekip sütunundaki her dizenin son üç karakterini içerdiğini unutmayın.

Bu, R esasını kullanan önceki yöntemin sonuçlarına karşılık gelir.

İlgili : R’deki str_sub işlevine giriş

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de belirli bir dize içeren sütunlar nasıl seçilir
R’de bir dizeden karakterler nasıl kaldırılır
R’de bir dizedeki karakter konumu nasıl bulunur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir