R을 고려하여 새 수준을 추가하는 방법(예제 포함)


다음 기본 구문을 사용하여 R의 요인 변수에 새 수준을 추가할 수 있습니다.

 levels(df$my_factor) <- c(levels(df$my_factor), ' new_level ')

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: R의 요인에 새 수준 추가

소매점의 여러 지역에서 발생한 판매량을 표시하는 다음과 같은 데이터 프레임이 R에 있다고 가정합니다.

 #create data frame
df <- data. frame (region=factor(c('A', 'B', NA, 'D', NA, 'F')),
                 sales=c(12, 18, 21, 14, 34, 40))

#view data frame
df

  regional sales
1 to 12
2 B 18
3 <NA> 21
4 D 14
5 <NA> 34
6 F 40

지역 변수가 요인이라는 점에 유의하세요.

이 요소의 수준을 시각화하려면 level() 함수를 사용할 수 있습니다.

 #view factor levels for region
levels(df$region)

[1] “A” “B” “D” “F”

다음 구문을 사용하여 “지역 없음”이라는 새 요인 수준을 추가할 수 있습니다.

 #add factor level called 'no region'
levels(df$region) <- c(levels(df$region), ' no region ')

#convert each NA to 'no region'
df$region[is. na (df$region)] <- ' no region '

#view factor levels for region
levels(df$region)

[1] “A” “B” “D” “F” “no region”

“지역 없음”이라는 새로운 수준이 요인 수준으로 추가되었습니다.

원하는 경우 table() 함수를 사용하여 각 요인 수준의 발생 횟수를 계산할 수 있습니다.

 #view occurrences of each factor level
table(df$region)

ABDF no region 
1 1 1 1 2 

결과에서 데이터 프레임의 지역 열에 “지역 없음”이라는 새로운 요인 수준이 두 번 나타나는 것을 확인할 수 있습니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 요소를 숫자로 변환하는 방법
R에서 요소를 문자로 변환하는 방법
R에서 요인 수준을 재정렬하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다