R에서 특정 문자 뒤에 문자열을 추출하는 방법


다음 방법을 사용하여 R에서 특정 문자 뒤의 문자열을 추출할 수 있습니다.

방법 1: Base R을 사용하여 특정 문자 뒤의 문자열 추출

 sub(' .*the ', '', my_string)

방법 2: stringr을 사용하여 특정 문자 뒤의 문자열 추출

 library (stringr)

str_replace(my_string, ' (.*?)the(.*?) ', ' \\1 ')

이 두 예제 모두 my_string 의 “the” 패턴 뒤에 있는 문자열을 추출합니다.

다음 예에서는 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('theMavs', 'theHeat', 'theNets', 'theRockets'),
                 dots=c(114, 135, 119, 140))

#view data frame
df

        team points
1 theMavs 114
2 theHeat 135
3 theNets 119
4 theRockets 140

예시 1: Base R을 사용하여 특정 문자 뒤의 문자열 추출

다음 코드는 데이터 프레임의 열에 있는 각 행의 “the” 뒤에 있는 문자열을 추출하는 방법을 보여줍니다.

 #create new column that extracts string after "the" in team column
df$team_name <- sub(' .*the ', '', df$team)

#view updated data frame
df

        team points team_name
1 theMavs 114 Mavs
2 theHeat 135 Heat
3 theNets 119 Nets
4 theRockets 140 Rockets

team_name 이라는 새 열에는 데이터 프레임의 열에 있는 각 행의 “the” 뒤에 문자열이 포함되어 있습니다.

관련 항목 : R의 sub() 소개

예시 2: stringr 패키지를 사용하여 특정 문자 뒤의 문자열 추출

다음 코드는 R의 stringr 패키지에서 str_replace() 함수를 사용하여 데이터 프레임의 열에 있는 각 행의 “the” 뒤에 있는 문자열을 추출하는 방법을 보여줍니다.

 library (stringr)

#create new column that extracts string after "the" in team column
df$team_name <- str_replace(df$team, ' (.*?)the(.*?)', '\\1 ')

#view updated data frame
df

           team points team_name
1 Mavs pro team 114 Mavs
2 team Heat pro 135 Heat
3 Nets pro team 119 Nets

team_name 이라는 새 열에는 데이터 프레임의 열에 있는 각 행의 “the” 뒤에 문자열이 포함되어 있습니다.

이는 기본 R에서 sub() 함수를 사용한 결과와 일치합니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 특정 문자열이 포함된 열을 선택하는 방법
R의 문자열에서 문자를 제거하는 방법
R의 문자열에서 문자 위치를 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다