R에서 droplevels 함수를 사용하는 방법(예제 포함)


R의 droplevels() 함수를 사용하면 사용되지 않는 요인 수준을 제거할 수 있습니다.

이 기능은 벡터 또는 데이터 프레임의 하위 집합으로 인해 더 이상 사용되지 않는 요인 수준을 제거하려는 경우 특히 유용합니다.

이 함수는 다음 구문을 사용합니다.

드롭 레벨(x)

여기서 x는 사용되지 않은 요인 수준을 제거할 개체입니다.

이 튜토리얼에서는 실제로 이 기능을 사용하는 방법에 대한 몇 가지 예를 제공합니다.

예 1: 벡터에서 사용되지 않은 요인 수준 제거

5개의 요인 수준을 갖는 데이터 벡터를 생성한다고 가정합니다. 다음으로, 원래 5개 요인 수준 중 3개만 사용하여 새 데이터 벡터를 정의한다고 가정합니다.

 #define data with 5 factor levels
data <- factor (c(1, 2, 3, 4, 5))

#define new data as original data minus 4th and 5th factor levels
new_data <- data[-c(4, 5)]

#view new data
new_data

[1] 1 2 3
Levels: 1 2 3 4 5

새 데이터에는 세 가지 요인만 포함되어 있지만 여전히 원래의 다섯 가지 요인 수준이 포함되어 있음을 알 수 있습니다.

이러한 사용되지 않는 요인 수준을 제거하려면 droplevels() 함수를 사용할 수 있습니다.

 #drop unused factor levels
new_data < -droplevels (new_data)

#view data
new_data

[1] 1 2 3
Levels: 1 2 3

이제 새 데이터에는 세 가지 수준의 요인만 포함됩니다.

예 2: 데이터 프레임에서 사용되지 않는 요인 수준 제거

변수 중 하나가 5단계 요인인 데이터 프레임을 생성한다고 가정합니다. 다음으로, 이러한 요인 수준 중 두 가지를 제거하는 새 데이터 프레임을 정의한다고 가정합니다.

 #create data frame
df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')),
                 sales = c(13, 16, 22, 27, 34))

#view data frame
df

  regional sales
1 to 13
2 B 16
3 C 22
4 D 27
5 E 34

#define new data frame
new_df <- subset (df, sales < 25)

#view new data frame
new_df

  regional sales
1 to 13
2 B 16
3 C 22

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C” “D” “E”

새 데이터베이스의 지역 열에는 세 가지 요인만 포함되어 있지만 여전히 원래의 다섯 가지 요인 수준이 포함되어 있습니다. 이 데이터를 사용하여 플롯을 만들려고 하면 문제가 발생할 수 있습니다.

지역 변수에서 사용되지 않는 요인 수준을 제거하려면 droplevels() 함수를 사용할 수 있습니다.

 #drop unused factor levels
new_df$region <- droplevels (new_df$region)

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C”

이제 지역 변수에는 세 가지 수준의 요인만 포함됩니다.

이 페이지 에서 더 많은 R 튜토리얼을 찾을 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다