A: bagaimana cara memeriksa apakah kolom berisi string


Anda dapat menggunakan metode berikut untuk memeriksa apakah kolom bingkai data di R berisi string:

Metode 1: Periksa apakah ada string yang tepat di kolom

 sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0

Metode 2: Periksa apakah ada sebagian string di kolom

 sum(str_detect(df$column_name, ' partial_string ')) > 0

Metode 3: Hitung kemunculan sebagian string di kolom

 sum(str_detect(df$column_name, ' partial_string '))

Tutorial ini menjelaskan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conf=c('East', 'East', 'South', 'West', 'West', 'East'),
                 dots=c(11, 14, 15, 15, 14, 19))

#view data frame
df

  team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19

Contoh 1: Periksa apakah ada string yang tepat di kolom

Kode berikut menunjukkan cara memeriksa apakah string “Eas” yang tepat ada di kolom conf pada bingkai data:

 #check if exact string 'Eas' exists in conf column
sum(str_detect(df$conf, ' ^Eas$ ')) > 0

[1] FALSE

Outputnya mengembalikan FALSE .

Ini memberitahu kita bahwa string ‘Eas’ yang sebenarnya tidak ada di kolom conf .

Catatan : Kami menggunakan simbol regex untuk menunjukkan karakter awal ( ^ ) dan akhir ( $ ) dari string yang kami cari.

Contoh 2: Periksa apakah ada sebagian string di kolom

Kode berikut menunjukkan cara memeriksa apakah sebagian string ‘Eas’ ada di kolom conf pada bingkai data:

 #check if partial string 'Eas' exists in conf column
sum(str_detect(df$conf, ' Eas ')) > 0

[1] TRUE

Outputnya mengembalikan TRUE .

Ini memberi tahu kita bahwa sebagian string ‘Eas’ ada di kolom conf pada bingkai data.

Contoh 3: Menghitung kemunculan sebagian string dalam kolom

Kode berikut menunjukkan cara menghitung berapa kali sebagian string “Eas” muncul di kolom conf pada bingkai data:

 #count occurrences of partial string 'Eas' in conf column
sum(str_detect(df$conf, ' Eas '))

[1] 3

Outputnya kembali 3 .

Ini memberitahu kita bahwa sebagian string ‘Eas’ muncul 3 kali di kolom conf bingkai data.

Terkait: Cara menggunakan fungsi str_detect() di R

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara memilih kolom yang berisi string tertentu di R
Cara menghapus karakter dari string di R
Cara menemukan lokasi karakter dalam string di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *