A: как проверить, содержит ли столбец строку
Вы можете использовать следующие методы, чтобы проверить, содержит ли столбец фрейма данных в R строку:
Способ 1. Проверьте, существует ли в столбце точная строка.
sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0
Способ 2: проверьте, существует ли в столбце частичная строка
sum(str_detect(df$column_name, ' partial_string ')) > 0
Способ 3: подсчитать вхождения частичных строк в столбце
sum(str_detect(df$column_name, ' partial_string '))
В этом руководстве объясняется, как использовать каждый метод на практике со следующим фреймом данных:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
conf=c('East', 'East', 'South', 'West', 'West', 'East'),
dots=c(11, 14, 15, 15, 14, 19))
#view data frame
df
team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19
Пример 1. Проверьте, существует ли в столбце точная строка
Следующий код показывает, как проверить, существует ли точная строка «Eas» в столбце conf фрейма данных:
#check if exact string 'Eas' exists in conf column sum(str_detect(df$conf, ' ^Eas$ ')) > 0 [1] FALSE
Выходные данные возвращают ЛОЖЬ .
Это говорит нам о том, что точная строка «Eas» не существует в столбце conf .
Примечание . Мы использовали символы регулярных выражений для обозначения начального ( ^ ) и конечного ( $ ) символов искомой строки.
Пример 2. Проверьте, существует ли в столбце неполная строка
Следующий код показывает, как проверить, существует ли частичная строка «Eas» в столбце conf фрейма данных:
#check if partial string 'Eas' exists in conf column sum(str_detect(df$conf, ' Eas ')) > 0 [1] TRUE
Выходные данные возвращают TRUE .
Это говорит нам о том, что частичная строка «Eas» существует в столбце conf кадра данных.
Пример 3. Подсчет вхождений частичной строки в столбец
Следующий код показывает, как подсчитать количество раз, когда частичная строка «Eas» появляется в столбце conf фрейма данных:
#count occurrences of partial string 'Eas' in conf column sum(str_detect(df$conf, ' Eas ')) [1] 3
Выходные данные возвращают 3 .
Это говорит нам о том, что частичная строка «Eas» появляется 3 раза в столбце conf фрейма данных.
Связано: Как использовать функцию str_detect() в R
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как выбрать столбцы, содержащие определенную строку в R
Как удалить символы из строки в R
Как найти местоположение символа в строке в R