Come utilizzare la funzione sottostringa in r (4 esempi)


La funzione substring() in R può essere utilizzata per estrarre una sottostringa in un vettore di caratteri.

Questa funzione utilizza la seguente sintassi:

 substring(text, first, last)

Oro:

  • testo: nome del vettore del carattere
  • first: il primo elemento da estrarre
  • last: l’ultimo elemento da estrarre

Tieni inoltre presente che la funzione substr() fa esattamente la stessa cosa, ma con nomi di argomenti leggermente diversi:

 substr(text, first, last)

Oro:

  • x: nome del vettore di caratteri
  • start: il primo elemento da estrarre
  • stop: l’ultimo elemento da estrarre

Gli esempi in questo tutorial mostrano come utilizzare in pratica la funzione substring() con il seguente frame di dati in R:

 #create data frame
df <- data. frame (team=c('Mavericks', 'Hornets', 'Rockets', 'Grizzlies'))

#view data frame
df

       team
1 Mavericks
2 Hornets
3 Rockets
4 Grizzlies

Esempio 1: estrarre i caratteri tra determinate posizioni

Il codice seguente mostra come utilizzare la funzione substring() per estrarre i caratteri tra le posizioni 2 e 5 della colonna “team”:

 #create new column that contains characters between positions 2 and 5
df$between2_5 <- substring(df$team, first= 2 , last= 5 )

#view updated data frame
df

       team between2_5
1 Mavericks aver
2 Hornets adorns
3 Rockets ocke
4 Rizz Grizzlies

Da notare che la nuova colonna contiene i caratteri compresi tra le posizioni 2 e 5 della colonna “team”.

Esempio 2: estrarre i primi N caratteri

Il codice seguente mostra come utilizzare la funzione substring() per estrarre i primi 3 caratteri dalla colonna “team”:

 #create new column that contains first 3 characters
df$first3 <- substring(df$team, first= 1 , last= 3 )

#view updated data frame
df

       team first3
1 Mavericks Mavs
2 Hornets Hor
3 Rockets Roc
4 Grizzlies Gray

Tieni presente che la nuova colonna contiene i primi tre caratteri della colonna “team”.

Esempio 3: estrarre gli ultimi N caratteri

Il codice seguente mostra come utilizzare la funzione substring() per estrarre gli ultimi 3 caratteri dalla colonna “team”:

 #create new column that contains last 3 characters
df$last3 <- substring(df$team, nchar (df$team)- 3 +1, nchar (df$team))

#view updated data frame
df

       team last3
1 Mavericks cks
2 Hornets ets
3 Rockets ets
4 Grizzlies ies

Tieni presente che la nuova colonna contiene gli ultimi tre caratteri della colonna “team”.

Esempio 4: sostituire una sottostringa

Il codice seguente mostra come utilizzare la funzione substring() per sostituire i primi 3 caratteri dei valori nella colonna “team” con 3 asterischi:

 #replace first 3 characters with asterisks in team column
substring(df$team, first= 1 , last= 3 ) <- " *** "

#view updated data frame
df

       team
1 ***ericks
2 ***net
3 ***kets
4 ***zzlies

Tieni presente che i primi tre caratteri del nome di ciascuna squadra sono stati sostituiti con asterischi.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni con le stringhe in R:

Come utilizzare str_replace in R
Come eseguire la corrispondenza parziale delle stringhe in R
Come convertire le stringhe in date in R
Come convertire un carattere in numerico in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *