Hoe een string vóór de spatie in r te extraheren


U kunt de volgende methoden gebruiken om een tekenreeks vóór een spatie in R te extraheren:

Methode 1: Extraheer de tekenreeks vóór de spatie met behulp van Base R

 gsub(“ .*$ ”, “”, my_string)

Methode 2: Extraheer de tekenreeks vóór de spatie met behulp van het stringr-pakket

 library (stringr)

word(my_string, 1)

Beide voorbeelden extraheren de string vóór de eerste spatie uit de string genaamd my_string .

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe:

 #create data frame
df <- data. frame (athlete=c('A', 'B', 'C', 'D'),
                 distance=c('23.2 miles', '14 miles', '5 miles', '9.3 miles'))

#view data frame
df

  distance athlete
1 to 23.2 miles
2 B 14 miles
3 C 5 miles
4 D 9.3 miles

Voorbeeld 1: Extraheer de tekenreeks vóór de spatie met Base R

De volgende code laat zien hoe u de tekenreeks vóór de spatie in elke tekenreeks in de afstandskolom van het dataframe kunt extraheren:

 #create new column that extracts string before space in distance column
df$distance_amount <- gsub( " .*$ ", "", df$distance) 

#view updated data frame
df

  athlete distance distance_amount
1 A 23.2 miles 23.2
2 B 14 miles 14
3 C 5 miles 5
4 D 9.3 miles 9.3

Merk op dat de nieuwe kolom genaamd distance_amount de string bevat vóór de spatie in de strings in de afstandskolom van het dataframe.

Gerelateerd : Een inleiding tot gsub() in R

Voorbeeld 2: Extraheer de tekenreeks vóór de spatie met behulp van het stringr-pakket

De volgende code laat zien hoe u de tekenreeks vóór de spatie in elke tekenreeks in de afstandskolom van het dataframe kunt extraheren met behulp van de functie word() van het stringr- pakket in R:

 library (stringr)

#create new column that extracts string before space in distance column
df$distance_amount <- word(df$distance, 1)

#view updated data frame
df

  athlete distance distance_amount
1 A 23.2 miles 23.2
2 B 14 miles 14
3 C 5 miles 5
4 D 9.3 miles 9.3

Merk op dat de nieuwe kolom genaamd distance_amount de string bevat vóór de spatie in de strings in de afstandskolom van het dataframe.

Dit komt overeen met de resultaten van het gebruik van de functie gsub() in basis R.

Merk op dat de functie word() van het stringr- pakket woorden uit een bepaalde string extraheert.

Door de waarde 1 aan deze functie op te geven, kunnen we het eerste gevonden woord in een string extraheren, wat gelijk staat aan het extraheren van de string vóór de eerste spatie.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe een string na een specifiek teken in R te extraheren
Hoe een string tussen specifieke karakters in R te extraheren
Hoe tekens uit een string in R te verwijderen
Hoe de tekenlocatie in een string in R te vinden

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert