R에서 strsplit() 함수를 사용하여 문자열 요소를 분할하는 방법
R의 strsplit() 함수는 문자열을 여러 조각으로 분할하는 데 사용할 수 있습니다. 이 함수는 다음 구문을 사용합니다.
strsplit(문자열, 패턴)
금:
- 문자열: 문자형 벡터
- 패턴: 나눌 패턴
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
예 1: 공백을 기준으로 문자열 분할
다음 코드는 strsplit() 함수를 사용하여 공백을 기준으로 문자열을 분할하는 방법을 보여줍니다.
#split string based on spaces
split_up <- strsplit(" Hey there people ", split="")
#view results
split_up
[[1]]
[1] “Hey” “there” “people”
#view class of split_up
class(split_up)
[1] "list"
결과는 원래 문자열의 공백을 기준으로 분할된 세 요소의 목록입니다.
결과로 벡터를 생성하려면 unlist() 함수를 대신 사용할 수 있습니다.
#split string based on spaces
split_up <- unlist(strsplit(" Hey there people ", split=" "))
#view results
split_up
[1] “Hey” “there” “people”
#view class of split_up
class(split_up)
[1] “character”
결과가 문자형 벡터임을 알 수 있습니다.
예 2: 사용자 정의 구분 기호를 기반으로 문자열 분할
또한 strplit() 함수를 사용하여 하이픈과 같은 사용자 정의 구분 기호를 기반으로 문자열을 분할할 수 있습니다.
#split string based on dashes
strsplit(" Hey-there-people ", split=" - ")
[[1]]
[1] “Hey” “there” “people”
결과는 원래 문자열의 하이픈을 기준으로 분할된 세 요소의 목록입니다.
예시 3: 여러 구분 기호를 기준으로 문자열 분할
또한 strplit() 함수의 분할 인수에 대괄호를 사용하여 여러 다른 구분 기호를 기반으로 문자열을 분할할 수도 있습니다.
#split string based on several delimiters
strsplit(" Hey&there-you/people ", split=" [&-/] ")
[[1]]
[1] “Hey” “there” “you” “people”
결과는 원래 문자열에 다음 구분 기호 중 하나가 있을 때마다 분할된 요소 목록입니다.
- 앰퍼샌드( & )
- 대시( – )
- 슬래시( / )
추가 리소스
다음 튜토리얼에서는 R에서 문자열을 사용하여 다른 일반적인 작업을 수행하는 방법을 설명합니다.
R에서 str_replace를 사용하는 방법
R에서 부분 문자열 일치를 수행하는 방법
R에서 문자열을 날짜로 변환하는 방법
R에서 문자를 숫자로 변환하는 방법