C: sütunun bir dize içerip içermediği nasıl kontrol edilir?
R’deki bir veri çerçevesinin bir sütununun bir dize içerip içermediğini kontrol etmek için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Sütunda tam dizenin mevcut olup olmadığını kontrol edin
sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0
Yöntem 2: Sütunda kısmi bir dize olup olmadığını kontrol edin
sum(str_detect(df$column_name, ' partial_string ')) > 0
Yöntem 3: Sütundaki kısmi dize oluşumlarını sayın
sum(str_detect(df$column_name, ' partial_string '))
Bu eğitimde her yöntemin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağı açıklanmaktadır:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
conf=c('East', 'East', 'South', 'West', 'West', 'East'),
dots=c(11, 14, 15, 15, 14, 19))
#view data frame
df
team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19
Örnek 1: Sütunda tam dizenin mevcut olup olmadığını kontrol edin
Aşağıdaki kod, veri çerçevesinin conf sütununda tam “Eas” dizesinin bulunup bulunmadığının nasıl kontrol edileceğini gösterir:
#check if exact string 'Eas' exists in conf column sum(str_detect(df$conf, ' ^Eas$ ')) > 0 [1] FALSE
Çıktı FALSE değerini döndürür.
Bu bize ‘Eas’ dizisinin tam olarak conf sütununda mevcut olmadığını söyler.
Not : Aradığımız stringin başlangıç ( ^ ) ve bitiş ( $ ) karakterlerini belirtmek için regex sembollerini kullandık.
Örnek 2: Sütunda kısmi bir dize olup olmadığını kontrol edin
Aşağıdaki kod, veri çerçevesinin conf sütununda kısmi ‘Eas’ dizesinin bulunup bulunmadığının nasıl kontrol edileceğini gösterir:
#check if partial string 'Eas' exists in conf column sum(str_detect(df$conf, ' Eas ')) > 0 [1] TRUE
Çıktı TRUE değerini döndürür.
Bu bize, veri çerçevesinin conf sütununda kısmi ‘Eas’ dizisinin mevcut olduğunu söyler.
Örnek 3: Kısmi bir dizenin bir sütundaki oluşumlarını sayın
Aşağıdaki kod, veri çerçevesinin conf sütununda “Eas” kısmi dizesinin kaç kez göründüğünün nasıl sayılacağını gösterir:
#count occurrences of partial string 'Eas' in conf column sum(str_detect(df$conf, ' Eas ')) [1] 3
Çıktı 3 değerini döndürür.
Bu bize kısmi ‘Eas’ dizisinin veri çerçevesinin conf sütununda 3 kez göründüğünü söyler.
İlgili: R’de str_detect() işlevi nasıl kullanılır?
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’de belirli bir dize içeren sütunlar nasıl seçilir
R’de bir dizeden karakterler nasıl kaldırılır
R’de bir dizedeki karakter konumu nasıl bulunur?