R을 고려하여 새 수준을 추가하는 방법(예제 포함)

에 의해 벤자민 앤더슨 7월 15, 2023 가이드 댓글 0개

다음 기본 구문을 사용하여 R의 요인 변수에 새 수준을 추가할 수 있습니다.

 levels(df$my_factor) <- c(levels(df$my_factor), ' new_level ')

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: R의 요인에 새 수준 추가

소매점의 여러 지역에서 발생한 판매량을 표시하는 다음과 같은 데이터 프레임이 R에 있다고 가정합니다.

 #create data frame
df <- data. frame (region=factor(c('A', 'B', NA, 'D', NA, 'F')),
                 sales=c(12, 18, 21, 14, 34, 40))

#view data frame
df

  regional sales
1 to 12
2 B 18
3 <NA> 21
4 D 14
5 <NA> 34
6 F 40

지역 변수가 요인이라는 점에 유의하세요.

이 요소의 수준을 시각화하려면 level() 함수를 사용할 수 있습니다.

 #view factor levels for region
levels(df$region)

[1] “A” “B” “D” “F”

다음 구문을 사용하여 “지역 없음”이라는 새 요인 수준을 추가할 수 있습니다.

 #add factor level called 'no region'
levels(df$region) <- c(levels(df$region), ' no region ')

#convert each NA to 'no region'
df$region[is. na (df$region)] <- ' no region '

#view factor levels for region
levels(df$region)

[1] “A” “B” “D” “F” “no region”

“지역 없음”이라는 새로운 수준이 요인 수준으로 추가되었습니다.

원하는 경우 table() 함수를 사용하여 각 요인 수준의 발생 횟수를 계산할 수 있습니다.

 #view occurrences of each factor level
table(df$region)

ABDF no region 
1 1 1 1 2

결과에서 데이터 프레임의 지역 열에 “지역 없음”이라는 새로운 요인 수준이 두 번 나타나는 것을 확인할 수 있습니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 요소를 숫자로 변환하는 방법
R에서 요소를 문자로 변환하는 방법
R에서 요인 수준을 재정렬하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예: R의 요인에 새 수준 추가

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다