A: 여러 구분 기호와 함께 strsplit()을 사용하는 방법


R의 strsplit() 함수와 함께 다음 기본 구문을 사용하여 여러 구분 기호를 기반으로 문자열을 조각으로 분할할 수 있습니다.

 strsplit(my_string, ' [,& ]+ ')

이 특정 예는 다음 세 가지 구분 기호 중 하나를 발견할 때마다 my_string 이라는 문자열을 분할합니다.

  • 쉼표( , )
  • 앰퍼샌드( & )
  • 지역

괄호 안의 문자는 검색할 구분 기호를 나타내고 + 기호는 행에 여러 개의 구분 기호가 있을 수 있음을 나타냅니다(예: 행에 공백이 여러 개 있을 수 있음).

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: R에서 여러 구분 기호와 함께 strsplit() 사용

R에 다음 문자열이 있다고 가정합니다.

 #create string
my_string <- 'this is a, string & with seven words'

strsplit() 함수를 사용하여 공백이 나타날 때마다 문자열을 분할하면 다음과 같은 결과가 생성됩니다.

 #split string based on spaces
strsplit(my_string, ' ')

[[1]]
 [1] "this" "is" "a," "string" "&" "with" "" ""      
 [9] “seven” “words”

strsplit() 함수는 공백이 나타날 때마다 문자열을 분할하지만 쉼표, 앰퍼샌드 및 여러 공백을 처리할 수 없습니다.

이러한 각 구분 기호를 기준으로 문자열을 분할하려면 다음 구문을 사용할 수 있습니다.

 #split string based on multiple delimiters
strsplit(my_string, ' [,& ]+ ')

[[1]]
[1] "this" "is" "a" "string" "with" "seven" "words" 

이 함수는 세 개의 서로 다른 구분 기호를 기반으로 문자열을 분할할 수 있으며 문자열에서 관심 있는 단어만 올바르게 반환합니다.

이 예에서는 strsplit() 함수에 대괄호로 묶인 구분 기호 세 개를 포함했지만 원하는 만큼 구분 기호를 지정할 수 있습니다.

추가 리소스

다음 튜토리얼에서는 dplyr을 사용하여 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 strsplit() 함수를 사용하여 문자열 요소를 분할하는 방법
문자열을 분할하고 R의 첫 번째 요소를 얻는 방법
R에서 문자열의 단어 수를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다