Jak wyodrębnić ciąg znaków przed spacją w r


Możesz użyć następujących metod, aby wyodrębnić ciąg znaków przed spacją w R:

Metoda 1: Wyodrębnij ciąg znaków przed spacją, używając podstawy R

 gsub(“ .*$ ”, “”, my_string)

Metoda 2: Wyodrębnij ciąg znaków przed spacją, używając pakietu stringr

 library (stringr)

word(my_string, 1)

Oba te przykłady wyodrębniają ciąg znaków przed pierwszą spacją z ciągu o nazwie mój_ciąg .

Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującą ramką danych:

 #create data frame
df <- data. frame (athlete=c('A', 'B', 'C', 'D'),
                 distance=c('23.2 miles', '14 miles', '5 miles', '9.3 miles'))

#view data frame
df

  distance athlete
1 to 23.2 miles
2 B 14 miles
3 C 5 miles
4 D 9.3 miles

Przykład 1: Wyodrębnij ciąg znaków przed spacją, używając podstawy R

Poniższy kod pokazuje, jak wyodrębnić ciąg znaków przed spacją w każdym ciągu w kolumnie odległości ramki danych:

 #create new column that extracts string before space in distance column
df$distance_amount <- gsub( " .*$ ", "", df$distance) 

#view updated data frame
df

  athlete distance distance_amount
1 A 23.2 miles 23.2
2 B 14 miles 14
3 C 5 miles 5
4 D 9.3 miles 9.3

Należy zauważyć, że nowa kolumna o nazwie odległość_kwota zawiera ciąg znaków przed spacją w ciągu znaków w kolumnie odległości ramki danych.

Powiązane : Wprowadzenie do gsub() w R

Przykład 2: Wyodrębnij ciąg znaków przed spacją, używając pakietu stringr

Poniższy kod pokazuje, jak wyodrębnić ciąg znaków przed spacją w każdym ciągu w kolumnie odległości ramki danych przy użyciu funkcji word() pakietu stringr w R:

 library (stringr)

#create new column that extracts string before space in distance column
df$distance_amount <- word(df$distance, 1)

#view updated data frame
df

  athlete distance distance_amount
1 A 23.2 miles 23.2
2 B 14 miles 14
3 C 5 miles 5
4 D 9.3 miles 9.3

Należy zauważyć, że nowa kolumna o nazwie odległość_kwota zawiera ciąg znaków przed spacją w ciągu znaków w kolumnie odległości ramki danych.

Odpowiada to wynikom użycia funkcji gsub() w bazie R.

Należy zauważyć, że funkcja word() pakietu stringr wyodrębnia słowa z danego ciągu.

Podając tej funkcji wartość 1 , możemy wyodrębnić pierwsze słowo znalezione w ciągu, co jest równoznaczne z wyodrębnieniem ciągu znaków przed pierwszą spacją.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak wyodrębnić ciąg znaków po określonym znaku w R
Jak wyodrębnić ciąg znaków między określonymi znakami w R
Jak usunąć znaki z ciągu w R
Jak znaleźć lokalizację znaku w ciągu w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *