Jak korzystać z funkcji podciągu w r (4 przykłady)


Funkcji substring() w R można użyć do wyodrębnienia podciągu z wektora znakowego.

Ta funkcja wykorzystuje następującą składnię:

 substring(text, first, last)

Złoto:

  • tekst: nazwa wektora znaków
  • First: Pierwszy element do wyodrębnienia
  • last: Ostatni element do wyodrębnienia

Zauważ też, że funkcja substr() robi dokładnie to samo, ale z nieco innymi nazwami argumentów:

 substr(text, first, last)

Złoto:

  • x: Nazwa wektora znaków
  • start: Pierwszy element do wyodrębnienia
  • stop: Ostatni element do wyodrębnienia

Przykłady w tym samouczku pokazują, jak w praktyce używać funkcji substring() z następującą ramką danych w R:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

Przykład 1: Wyodrębnij znaki pomiędzy określonymi pozycjami

Poniższy kod pokazuje, jak używać funkcji substring() do wyodrębniania znaków pomiędzy pozycjami 2 i 5 kolumny „team”:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

Należy pamiętać, że nowa kolumna zawiera znaki pomiędzy pozycjami 2 i 5 kolumny „zespół”.

Przykład 2: Wyodrębnij pierwsze N znaków

Poniższy kod pokazuje, jak użyć funkcji substring() do wyodrębnienia pierwszych 3 znaków z kolumny „zespół”:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

Zwróć uwagę, że nowa kolumna zawiera pierwsze trzy znaki kolumny „zespół”.

Przykład 3: Wyodrębnij N ostatnich znaków

Poniższy kod pokazuje, jak użyć funkcji substring() do wyodrębnienia 3 ostatnich znaków z kolumny „zespół”:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

Zwróć uwagę, że nowa kolumna zawiera trzy ostatnie znaki kolumny „zespół”.

Przykład 4: Zamień podciąg

Poniższy kod pokazuje, jak użyć funkcji substring() do zastąpienia pierwszych 3 znaków wartości w kolumnie „zespół” 3 gwiazdkami:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

Zwróć uwagę, że pierwsze trzy znaki nazwy każdego zespołu zostały zastąpione gwiazdkami.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na ciągach w języku R:

Jak używać str_replace w R
Jak wykonać częściowe dopasowanie ciągów w R
Jak przekonwertować ciągi znaków na daty w R
Jak przekonwertować znak na numeryczny w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *