R에서 str_split을 사용하는 방법(예제 포함)


R의 stringr 패키지의 str_split() 함수를 사용하면 문자열을 여러 조각으로 분할할 수 있습니다. 이 함수는 다음 구문을 사용합니다.

str_split(문자열, 패턴)

금:

  • 문자열: 문자형 벡터
  • 패턴: 나눌 패턴

마찬가지로 stringr 패키지의 str_split_fixed() 함수를 사용하여 문자열을 고정된 수의 청크로 분할할 수 있습니다. 이 함수는 다음 구문을 사용합니다.

str_split_fixed(문자열, 패턴, n)

금:

  • 문자열: 문자형 벡터
  • 패턴: 나눌 패턴
  • n: 반환할 조각 수

이 튜토리얼에서는 다음 데이터 프레임에서 이러한 각 함수를 사용하는 예를 제공합니다.

 #create data frame
df <- data. frame (team=c('andy & bob', 'carl & doug', 'eric & frank'),
                 dots=c(14, 17, 19))

#view data frame
df

          team points
1 andy & bob 14
2 carl & doug 17
3 eric & frank 19

예제 1: str_split()을 사용하여 문자열 분할

다음 코드는 str_split() 함수를 사용하여 “team” 열의 문자열을 분할하는 방법을 보여줍니다.

 library (stringr)

#split the string in the team column on " & "
str_split(df$team, " & ")

[[1]]
[1] “andy” “bob” 

[[2]]
[1] “carl” “doug”

[[3]]
[1] “eric” “frank”

결과는 각 팀의 개별 플레이어 이름을 표시하는 세 가지 항목의 목록입니다.

예제 2: str_split_fixed()를 사용하여 문자열 분할

다음 코드는 str_split_fixed() 함수를 사용하여 “team” 열의 문자열을 두 개의 고정 조각으로 분할하는 방법을 보여줍니다.

 library (stringr)

#split the string in the team column on " & "
str_split_fixed(df$team, " & ", 2)

     [,1] [,2]   
[1,] “andy” “bob”  
[2,] "carl" "doug" 
[3,] "eric" "frank"

결과는 2개의 열과 3개의 행으로 구성된 행렬입니다.

str_split_fixed() 함수의 유용한 응용 프로그램은 결과 행렬을 데이터 프레임 끝에 추가하는 것입니다. 예를 들어:

 library (stringr)

#split the string in the team column and append resulting matrix to data frame
df[, 3:4] <- str_split_fixed(df$team, " & ", 2)

#view data frame
df
          team points V3 V4
1 andy & bob 14 andy bob
2 carl & doug 17 carl doug
3 eric & frank 19 eric frank

“V3” 열에는 첫 번째 팀 플레이어의 이름이 표시되고 “V4” 열에는 두 번째 팀 플레이어의 이름이 표시됩니다.

추가 리소스

R에서 str_replace를 사용하는 방법
R에서 부분 문자열 일치를 수행하는 방법
R에서 문자열을 날짜로 변환하는 방법
R에서 문자를 숫자로 변환하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다