Odp.: jak sprawdzić, czy kolumna zawiera ciąg znaków


Możesz użyć następujących metod, aby sprawdzić, czy kolumna ramki danych w R zawiera ciąg znaków:

Metoda 1: Sprawdź, czy w kolumnie istnieje dokładny ciąg

 sum(str_detect(df$column_name, ' ^exact_string$ ')) > 0

Metoda 2: Sprawdź, czy w kolumnie istnieje częściowy ciąg znaków

 sum(str_detect(df$column_name, ' partial_string ')) > 0

Metoda 3: Zliczanie częściowych wystąpień ciągu w kolumnie

 sum(str_detect(df$column_name, ' partial_string '))

W tym samouczku wyjaśniono, jak w praktyce używać każdej metody z następującą ramką danych:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'),
                 conf=c('East', 'East', 'South', 'West', 'West', 'East'),
                 dots=c(11, 14, 15, 15, 14, 19))

#view data frame
df

  team conf points
1 A East 11
2 A East 14
3 A South 15
4 B West 15
5 B West 14
6C East 19

Przykład 1: Sprawdź, czy w kolumnie istnieje dokładny ciąg

Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie conf ramki danych istnieje dokładny ciąg „Eas”:

 #check if exact string 'Eas' exists in conf column
sum(str_detect(df$conf, ' ^Eas$ ')) > 0

[1] FALSE

Dane wyjściowe zwracają FAŁSZ .

To mówi nam, że dokładny ciąg „Eas” nie istnieje w kolumnie conf .

Uwaga : Użyliśmy symboli wyrażeń regularnych, aby wskazać początek ( ^ ) i koniec ( $ ) znaków szukanego ciągu.

Przykład 2: Sprawdź, czy w kolumnie istnieje częściowy ciąg znaków

Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie conf ramki danych istnieje częściowy ciąg „Eas”:

 #check if partial string 'Eas' exists in conf column
sum(str_detect(df$conf, ' Eas ')) > 0

[1] TRUE

Dane wyjściowe zwracają wartość TRUE .

To mówi nam, że częściowy ciąg „Eas” istnieje w kolumnie conf ramki danych.

Przykład 3: Zliczanie wystąpień częściowego ciągu w kolumnie

Poniższy kod pokazuje, jak policzyć, ile razy częściowy ciąg „Eas” pojawia się w kolumnie conf ramki danych:

 #count occurrences of partial string 'Eas' in conf column
sum(str_detect(df$conf, ' Eas '))

[1] 3

Dane wyjściowe zwracają 3 .

To mówi nam, że częściowy ciąg „Eas” pojawia się 3 razy w kolumnie conf ramki danych.

Powiązane: Jak używać funkcji str_detect() w R

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak wybrać kolumny zawierające określony ciąg w R
Jak usunąć znaki z ciągu w R
Jak znaleźć lokalizację znaku w ciągu w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *