Odp.: jak sprawdzić, czy kolumna zawiera ciąg znaków
Możesz użyć następujących metod, aby sprawdzić, czy kolumna ramki danych w R zawiera ciąg znaków:
Metoda 1: Sprawdź, czy w kolumnie istnieje dokładny ciąg
sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0
Metoda 2: Sprawdź, czy w kolumnie istnieje częściowy ciąg znaków
sum(str_detect(df$column_name, ' partial_string ')) > 0
Metoda 3: Zliczanie częściowych wystąpień ciągu w kolumnie
sum(str_detect(df$column_name, ' partial_string '))
W tym samouczku wyjaśniono, jak w praktyce używać każdej metody z następującą ramką danych:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
conf=c('East', 'East', 'South', 'West', 'West', 'East'),
dots=c(11, 14, 15, 15, 14, 19))
#view data frame
df
team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19
Przykład 1: Sprawdź, czy w kolumnie istnieje dokładny ciąg
Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie conf ramki danych istnieje dokładny ciąg „Eas”:
#check if exact string 'Eas' exists in conf column sum(str_detect(df$conf, ' ^Eas$ ')) > 0 [1] FALSE
Dane wyjściowe zwracają FAŁSZ .
To mówi nam, że dokładny ciąg „Eas” nie istnieje w kolumnie conf .
Uwaga : Użyliśmy symboli wyrażeń regularnych, aby wskazać początek ( ^ ) i koniec ( $ ) znaków szukanego ciągu.
Przykład 2: Sprawdź, czy w kolumnie istnieje częściowy ciąg znaków
Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie conf ramki danych istnieje częściowy ciąg „Eas”:
#check if partial string 'Eas' exists in conf column sum(str_detect(df$conf, ' Eas ')) > 0 [1] TRUE
Dane wyjściowe zwracają wartość TRUE .
To mówi nam, że częściowy ciąg „Eas” istnieje w kolumnie conf ramki danych.
Przykład 3: Zliczanie wystąpień częściowego ciągu w kolumnie
Poniższy kod pokazuje, jak policzyć, ile razy częściowy ciąg „Eas” pojawia się w kolumnie conf ramki danych:
#count occurrences of partial string 'Eas' in conf column sum(str_detect(df$conf, ' Eas ')) [1] 3
Dane wyjściowe zwracają 3 .
To mówi nam, że częściowy ciąg „Eas” pojawia się 3 razy w kolumnie conf ramki danych.
Powiązane: Jak używać funkcji str_detect() w R
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak wybrać kolumny zawierające określony ciąg w R
Jak usunąć znaki z ciągu w R
Jak znaleźć lokalizację znaku w ciągu w R