R: 문자열 끝에서 부분 문자열 추출


다음 방법을 사용하여 문자열 끝부터 시작하여 R의 하위 문자열을 추출할 수 있습니다.

방법 1: 기본 R 사용

 #define function to extract n characters starting from end
substr_end <- function (x, n){
  substr(x, nchar(x)-n+ 1 , nchar(x))
}

#extract 3 characters starting from end
substr_end(my_string, 3 )

방법 2: stringr 패키지 사용

 library (stringr)

#extract 3 characters starting from end 
str_sub(my_string, start = - 3 )

이 두 예제는 my_string 이라는 문자열에서 마지막 세 문자를 추출합니다.

다음 예에서는 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('Mavericks', 'Lakers', 'Hawks', 'Nets', 'Warriors'),
                 dots=c(100, 143, 129, 113, 123))

#view data frame
df

       team points
1 Mavericks 100
2 Lakers 143
3 Hawks 129
4 Nets 113
5 Warriors 123

예 1: Base R을 사용하여 끝에서 부분 문자열 추출

다음 코드는 기본 R에서 사용자 정의 함수를 정의한 다음 이 함수를 사용하여 열의 각 문자열에서 마지막 세 문자를 추출하는 방법을 보여줍니다.

 #define function to extract n characters starting from end
substr_end <- function (x, n){
  substr(x, nchar(x)-n+ 1 , nchar(x))
}

#create new column that extracts last 3 characters from team column
df$team_last3 <- substr_end(my_string, 3 )

#view updated data frame
df

       team points team_last3
1 Mavericks 100 cks
2 Lakers 143ers
3 Hawks 129 wks
4 Nets 113 ets
5 Warriors 123 gold

team_last3 이라는 새 열에는 데이터 프레임의 열에 있는 각 문자열의 마지막 세 문자가 포함되어 있습니다.

예시 2: stringr 패키지를 사용하여 끝에서 부분 문자열 추출

다음 코드는 R의 stringr 패키지에 있는 str_sub() 함수를 사용하여 열의 각 문자열에서 마지막 세 문자를 추출하는 방법을 보여줍니다.

 library (stringr)

#create new column that extracts last 3 characters from team column
df$team_last3 <- str_sub(df$team, start = - 3 )

#view updated data frame
df

       team points team_last3
1 Mavericks 100 cks
2 Lakers 143ers
3 Hawks 129 wks
4 Nets 113 ets
5 Warriors 123 gold

team_last3 이라는 새 열에는 데이터 프레임의 열에 있는 각 문자열의 마지막 세 문자가 포함되어 있습니다.

이는 R 기반을 사용한 이전 방법의 결과에 해당합니다.

관련 항목 : R의 str_sub 함수 소개

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 특정 문자열이 포함된 열을 선택하는 방법
R의 문자열에서 문자를 제거하는 방법
R의 문자열에서 문자 위치를 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다