R: come utilizzare strsplit() con più delimitatori
È possibile utilizzare la seguente sintassi di base con la funzione strsplit() in R per dividere una stringa in parti in base a più delimitatori:
strsplit(my_string, ' [,& ]+ ')
Questo particolare esempio divide la stringa chiamata my_string ogni volta che incontra uno dei seguenti tre delimitatori:
- Per ordinare ( , )
- Una e commerciale ( & )
- Un’area
Tieni presente che i caratteri tra parentesi indicano quali delimitatori cercare e il segno + indica che potrebbero esserci più delimitatori in una riga (ad esempio, potrebbero esserci più spazi in una riga).
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: utilizzare strsplit() con più delimitatori in R
Supponiamo di avere la seguente stringa in R:
#create string
my_string <- 'this is a, string & with seven words'
Se utilizziamo la funzione strsplit() per dividere la stringa ogni volta che viene incontrato uno spazio, produrrà il seguente risultato:
#split string based on spaces
strsplit(my_string, ' ')
[[1]]
[1] "this" "is" "a," "string" "&" "with" "" ""
[9] “seven” “words”
La funzione strsplit() divide la stringa ogni volta che viene incontrato uno spazio, ma non è in grado di gestire virgole, e commerciali e spazi multipli.
Per dividere la stringa in base a ciascuno di questi delimitatori, possiamo utilizzare la seguente sintassi:
#split string based on multiple delimiters
strsplit(my_string, ' [,& ]+ ')
[[1]]
[1] "this" "is" "a" "string" "with" "seven" "words"
Questa funzione è in grado di dividere la stringa in base a tre diversi delimitatori e restituisce correttamente solo le parole della stringa che ci interessano.
Tieni presente che in questo esempio abbiamo incluso tre delimitatori tra parentesi nella funzione strsplit() ma puoi specificare tutti i delimitatori che desideri.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni utilizzando dplyr:
Come utilizzare la funzione strsplit() in R per dividere gli elementi stringa
Come dividere una stringa e ottenere il primo elemento in R
Come contare le parole in una stringa in R