R에서 droplevels 함수를 사용하는 방법(예제 포함)
R의 droplevels() 함수를 사용하면 사용되지 않는 요인 수준을 제거할 수 있습니다.
이 기능은 벡터 또는 데이터 프레임의 하위 집합으로 인해 더 이상 사용되지 않는 요인 수준을 제거하려는 경우 특히 유용합니다.
이 함수는 다음 구문을 사용합니다.
드롭 레벨(x)
여기서 x는 사용되지 않은 요인 수준을 제거할 개체입니다.
이 튜토리얼에서는 실제로 이 기능을 사용하는 방법에 대한 몇 가지 예를 제공합니다.
예 1: 벡터에서 사용되지 않은 요인 수준 제거
5개의 요인 수준을 갖는 데이터 벡터를 생성한다고 가정합니다. 다음으로, 원래 5개 요인 수준 중 3개만 사용하여 새 데이터 벡터를 정의한다고 가정합니다.
#define data with 5 factor levels data <- factor (c(1, 2, 3, 4, 5)) #define new data as original data minus 4th and 5th factor levels new_data <- data[-c(4, 5)] #view new data new_data [1] 1 2 3 Levels: 1 2 3 4 5
새 데이터에는 세 가지 요인만 포함되어 있지만 여전히 원래의 다섯 가지 요인 수준이 포함되어 있음을 알 수 있습니다.
이러한 사용되지 않는 요인 수준을 제거하려면 droplevels() 함수를 사용할 수 있습니다.
#drop unused factor levels new_data < -droplevels (new_data) #view data new_data [1] 1 2 3 Levels: 1 2 3
이제 새 데이터에는 세 가지 수준의 요인만 포함됩니다.
예 2: 데이터 프레임에서 사용되지 않는 요인 수준 제거
변수 중 하나가 5단계 요인인 데이터 프레임을 생성한다고 가정합니다. 다음으로, 이러한 요인 수준 중 두 가지를 제거하는 새 데이터 프레임을 정의한다고 가정합니다.
#create data frame df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')), sales = c(13, 16, 22, 27, 34)) #view data frame df regional sales 1 to 13 2 B 16 3 C 22 4 D 27 5 E 34 #define new data frame new_df <- subset (df, sales < 25) #view new data frame new_df regional sales 1 to 13 2 B 16 3 C 22 #check levels of region variable levels (new_df$region) [1] “A” “B” “C” “D” “E”
새 데이터베이스의 지역 열에는 세 가지 요인만 포함되어 있지만 여전히 원래의 다섯 가지 요인 수준이 포함되어 있습니다. 이 데이터를 사용하여 플롯을 만들려고 하면 문제가 발생할 수 있습니다.
지역 변수에서 사용되지 않는 요인 수준을 제거하려면 droplevels() 함수를 사용할 수 있습니다.
#drop unused factor levels new_df$region <- droplevels (new_df$region) #check levels of region variable levels (new_df$region) [1] “A” “B” “C”
이제 지역 변수에는 세 가지 수준의 요인만 포함됩니다.
이 페이지 에서 더 많은 R 튜토리얼을 찾을 수 있습니다.