R에서 str_split을 사용하는 방법(예제 포함)
R의 stringr 패키지의 str_split() 함수를 사용하면 문자열을 여러 조각으로 분할할 수 있습니다. 이 함수는 다음 구문을 사용합니다.
str_split(문자열, 패턴)
금:
- 문자열: 문자형 벡터
- 패턴: 나눌 패턴
마찬가지로 stringr 패키지의 str_split_fixed() 함수를 사용하여 문자열을 고정된 수의 청크로 분할할 수 있습니다. 이 함수는 다음 구문을 사용합니다.
str_split_fixed(문자열, 패턴, n)
금:
- 문자열: 문자형 벡터
- 패턴: 나눌 패턴
- n: 반환할 조각 수
이 튜토리얼에서는 다음 데이터 프레임에서 이러한 각 함수를 사용하는 예를 제공합니다.
#create data frame df <- data. frame (team=c('andy & bob', 'carl & doug', 'eric & frank'), dots=c(14, 17, 19)) #view data frame df team points 1 andy & bob 14 2 carl & doug 17 3 eric & frank 19
예제 1: str_split()을 사용하여 문자열 분할
다음 코드는 str_split() 함수를 사용하여 “team” 열의 문자열을 분할하는 방법을 보여줍니다.
library (stringr) #split the string in the team column on " & " str_split(df$team, " & ") [[1]] [1] “andy” “bob” [[2]] [1] “carl” “doug” [[3]] [1] “eric” “frank”
결과는 각 팀의 개별 플레이어 이름을 표시하는 세 가지 항목의 목록입니다.
예제 2: str_split_fixed()를 사용하여 문자열 분할
다음 코드는 str_split_fixed() 함수를 사용하여 “team” 열의 문자열을 두 개의 고정 조각으로 분할하는 방법을 보여줍니다.
library (stringr)
#split the string in the team column on " & "
str_split_fixed(df$team, " & ", 2)
[,1] [,2]
[1,] “andy” “bob”
[2,] "carl" "doug"
[3,] "eric" "frank"
결과는 2개의 열과 3개의 행으로 구성된 행렬입니다.
str_split_fixed() 함수의 유용한 응용 프로그램은 결과 행렬을 데이터 프레임 끝에 추가하는 것입니다. 예를 들어:
library (stringr)
#split the string in the team column and append resulting matrix to data frame
df[, 3:4] <- str_split_fixed(df$team, " & ", 2)
#view data frame
df
team points V3 V4
1 andy & bob 14 andy bob
2 carl & doug 17 carl doug
3 eric & frank 19 eric frank
“V3” 열에는 첫 번째 팀 플레이어의 이름이 표시되고 “V4” 열에는 두 번째 팀 플레이어의 이름이 표시됩니다.
추가 리소스
R에서 str_replace를 사용하는 방법
R에서 부분 문자열 일치를 수행하는 방법
R에서 문자열을 날짜로 변환하는 방법
R에서 문자를 숫자로 변환하는 방법