A: как проверить, содержит ли столбец строку


Вы можете использовать следующие методы, чтобы проверить, содержит ли столбец фрейма данных в R строку:

Способ 1. Проверьте, существует ли в столбце точная строка.

 sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0

Способ 2: проверьте, существует ли в столбце частичная строка

 sum(str_detect(df$column_name, ' partial_string ')) > 0

Способ 3: подсчитать вхождения частичных строк в столбце

 sum(str_detect(df$column_name, ' partial_string '))

В этом руководстве объясняется, как использовать каждый метод на практике со следующим фреймом данных:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conf=c('East', 'East', 'South', 'West', 'West', 'East'),
                 dots=c(11, 14, 15, 15, 14, 19))

#view data frame
df

  team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19

Пример 1. Проверьте, существует ли в столбце точная строка

Следующий код показывает, как проверить, существует ли точная строка «Eas» в столбце conf фрейма данных:

 #check if exact string 'Eas' exists in conf column
sum(str_detect(df$conf, ' ^Eas$ ')) > 0

[1] FALSE

Выходные данные возвращают ЛОЖЬ .

Это говорит нам о том, что точная строка «Eas» не существует в столбце conf .

Примечание . Мы использовали символы регулярных выражений для обозначения начального ( ^ ) и конечного ( $ ) символов искомой строки.

Пример 2. Проверьте, существует ли в столбце неполная строка

Следующий код показывает, как проверить, существует ли частичная строка «Eas» в столбце conf фрейма данных:

 #check if partial string 'Eas' exists in conf column
sum(str_detect(df$conf, ' Eas ')) > 0

[1] TRUE

Выходные данные возвращают TRUE .

Это говорит нам о том, что частичная строка «Eas» существует в столбце conf кадра данных.

Пример 3. Подсчет вхождений частичной строки в столбец

Следующий код показывает, как подсчитать количество раз, когда частичная строка «Eas» появляется в столбце conf фрейма данных:

 #count occurrences of partial string 'Eas' in conf column
sum(str_detect(df$conf, ' Eas '))

[1] 3

Выходные данные возвращают 3 .

Это говорит нам о том, что частичная строка «Eas» появляется 3 раза в столбце conf фрейма данных.

Связано: Как использовать функцию str_detect() в R

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как выбрать столбцы, содержащие определенную строку в R
Как удалить символы из строки в R
Как найти местоположение символа в строке в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *