R: come utilizzare strsplit() con più delimitatori


È possibile utilizzare la seguente sintassi di base con la funzione strsplit() in R per dividere una stringa in parti in base a più delimitatori:

 strsplit(my_string, ' [,& ]+ ')

Questo particolare esempio divide la stringa chiamata my_string ogni volta che incontra uno dei seguenti tre delimitatori:

  • Per ordinare ( , )
  • Una e commerciale ( & )
  • Un’area

Tieni presente che i caratteri tra parentesi indicano quali delimitatori cercare e il segno + indica che potrebbero esserci più delimitatori in una riga (ad esempio, potrebbero esserci più spazi in una riga).

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: utilizzare strsplit() con più delimitatori in R

Supponiamo di avere la seguente stringa in R:

 #create string
my_string <- 'this is a, string & with seven words'

Se utilizziamo la funzione strsplit() per dividere la stringa ogni volta che viene incontrato uno spazio, produrrà il seguente risultato:

 #split string based on spaces
strsplit(my_string, ' ')

[[1]]
 [1] "this" "is" "a," "string" "&" "with" "" ""      
 [9] “seven” “words”

La funzione strsplit() divide la stringa ogni volta che viene incontrato uno spazio, ma non è in grado di gestire virgole, e commerciali e spazi multipli.

Per dividere la stringa in base a ciascuno di questi delimitatori, possiamo utilizzare la seguente sintassi:

 #split string based on multiple delimiters
strsplit(my_string, ' [,& ]+ ')

[[1]]
[1] "this" "is" "a" "string" "with" "seven" "words" 

Questa funzione è in grado di dividere la stringa in base a tre diversi delimitatori e restituisce correttamente solo le parole della stringa che ci interessano.

Tieni presente che in questo esempio abbiamo incluso tre delimitatori tra parentesi nella funzione strsplit() ma puoi specificare tutti i delimitatori che desideri.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni utilizzando dplyr:

Come utilizzare la funzione strsplit() in R per dividere gli elementi stringa
Come dividere una stringa e ottenere il primo elemento in R
Come contare le parole in una stringa in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *