A: 여러 구분 기호와 함께 strsplit()을 사용하는 방법
R의 strsplit() 함수와 함께 다음 기본 구문을 사용하여 여러 구분 기호를 기반으로 문자열을 조각으로 분할할 수 있습니다.
strsplit(my_string, ' [,& ]+ ')
이 특정 예는 다음 세 가지 구분 기호 중 하나를 발견할 때마다 my_string 이라는 문자열을 분할합니다.
- 쉼표( , )
- 앰퍼샌드( & )
- 지역
괄호 안의 문자는 검색할 구분 기호를 나타내고 + 기호는 행에 여러 개의 구분 기호가 있을 수 있음을 나타냅니다(예: 행에 공백이 여러 개 있을 수 있음).
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: R에서 여러 구분 기호와 함께 strsplit() 사용
R에 다음 문자열이 있다고 가정합니다.
#create string
my_string <- 'this is a, string & with seven words'
strsplit() 함수를 사용하여 공백이 나타날 때마다 문자열을 분할하면 다음과 같은 결과가 생성됩니다.
#split string based on spaces
strsplit(my_string, ' ')
[[1]]
[1] "this" "is" "a," "string" "&" "with" "" ""
[9] “seven” “words”
strsplit() 함수는 공백이 나타날 때마다 문자열을 분할하지만 쉼표, 앰퍼샌드 및 여러 공백을 처리할 수 없습니다.
이러한 각 구분 기호를 기준으로 문자열을 분할하려면 다음 구문을 사용할 수 있습니다.
#split string based on multiple delimiters
strsplit(my_string, ' [,& ]+ ')
[[1]]
[1] "this" "is" "a" "string" "with" "seven" "words"
이 함수는 세 개의 서로 다른 구분 기호를 기반으로 문자열을 분할할 수 있으며 문자열에서 관심 있는 단어만 올바르게 반환합니다.
이 예에서는 strsplit() 함수에 대괄호로 묶인 구분 기호 세 개를 포함했지만 원하는 만큼 구분 기호를 지정할 수 있습니다.
추가 리소스
다음 튜토리얼에서는 dplyr을 사용하여 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 strsplit() 함수를 사용하여 문자열 요소를 분할하는 방법
문자열을 분할하고 R의 첫 번째 요소를 얻는 방법
R에서 문자열의 단어 수를 계산하는 방법