R에서 문자열의 단어 수를 세는 방법(예제 포함)


R에서 문자열의 단어 수를 계산하는 데 사용할 수 있는 세 가지 방법이 있습니다.

방법 1: 기본 R 사용

 lengths(strsplit(my_string, ' '))

방법 2: stringi 패키지 사용

 library (stringi)

stri_count_words(my_string)

방법 3: stringr 패키지 사용

 library (stringr)

str_count(my_string, ' \\w+ ')

이러한 각 메소드는 my_string 이라는 문자열의 단어 수를 나타내는 숫자 값을 반환합니다.

다음 예에서는 이러한 각 방법을 실제로 사용하는 방법을 보여줍니다.

예시 1: 기본 R을 사용하여 단어 수 계산

다음 코드는 R 기본 함수 lengthsstrsplit을 사용하여 문자열의 단어 수를 계산하는 방법을 보여줍니다.

 #create string
my_string <- 'this is a string with seven words'

#count number of words in string
lengths(strsplit(my_string, ' '))

[1] 7

결과에서 문자열에 7개의 단어가 있음을 알 수 있습니다.

관련 항목: R에서 strsplit() 함수를 사용하여 문자열 요소를 분할하는 방법

예제 2: stringi 패키지를 사용하여 단어 계산

다음 코드는 R의 stringi 패키지에 있는 stri_count_words 함수를 사용하여 문자열의 단어 수를 계산하는 방법을 보여줍니다.

 library (stringi)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
stri_count_words(my_string)

[1] 7

결과에서 문자열에 7개의 단어가 있음을 알 수 있습니다.

예제 3: stringr 패키지를 사용하여 단어 수 계산

다음 코드는 R의 stringr 패키지에 있는 str_count 함수를 사용하여 문자열의 단어 수를 계산하는 방법을 보여줍니다.

 library (stringr)

#create string
my_string <- 'this is a string with seven words'

#count number of words in string
str_count(my_string, ' \\w+ ')

[1] 7

결과에서 문자열에 7개의 단어가 있음을 알 수 있습니다.

하나 이상의 연속된 문자를 나타내기 위해 단어가 아닌 문자를 + 기호와 일치시키기 위해 정규식 \\w+ 를 사용했습니다.

참고 : 이러한 각 예에서는 단일 문자열의 단어 수를 계산했지만 각 방법은 문자열 벡터에서도 작동합니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R의 문자열에서 문자 위치를 찾는 방법
R의 문자열에서 문자를 제거하는 방법
R에서 특정 문자열이 포함된 열을 선택하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다