R을 고려하여 새 수준을 추가하는 방법(예제 포함)
다음 기본 구문을 사용하여 R의 요인 변수에 새 수준을 추가할 수 있습니다.
levels(df$my_factor) <- c(levels(df$my_factor), ' new_level ')
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: R의 요인에 새 수준 추가
소매점의 여러 지역에서 발생한 판매량을 표시하는 다음과 같은 데이터 프레임이 R에 있다고 가정합니다.
#create data frame
df <- data. frame (region=factor(c('A', 'B', NA, 'D', NA, 'F')),
sales=c(12, 18, 21, 14, 34, 40))
#view data frame
df
regional sales
1 to 12
2 B 18
3 <NA> 21
4 D 14
5 <NA> 34
6 F 40
지역 변수가 요인이라는 점에 유의하세요.
이 요소의 수준을 시각화하려면 level() 함수를 사용할 수 있습니다.
#view factor levels for region
levels(df$region)
[1] “A” “B” “D” “F”
다음 구문을 사용하여 “지역 없음”이라는 새 요인 수준을 추가할 수 있습니다.
#add factor level called 'no region' levels(df$region) <- c(levels(df$region), ' no region ') #convert each NA to 'no region' df$region[is. na (df$region)] <- ' no region ' #view factor levels for region levels(df$region) [1] “A” “B” “D” “F” “no region”
“지역 없음”이라는 새로운 수준이 요인 수준으로 추가되었습니다.
원하는 경우 table() 함수를 사용하여 각 요인 수준의 발생 횟수를 계산할 수 있습니다.
#view occurrences of each factor level
table(df$region)
ABDF no region
1 1 1 1 2
결과에서 데이터 프레임의 지역 열에 “지역 없음”이라는 새로운 요인 수준이 두 번 나타나는 것을 확인할 수 있습니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.