R에서 범주형 변수를 숫자로 변환하는 방법
다음 방법 중 하나를 사용하여 R에서 범주형 변수를 숫자형 변수로 변환할 수 있습니다.
방법 1: 범주형 변수를 숫자로 변환
df$var1 <- unclass(df$var1)
방법 2: 여러 범주형 변수를 숫자 값으로 변환
df[, c(' var1 ', ' var2 ')] <- sapply(df[, c(' var1 ', ' var2 ')], unclass)
방법 3: 모든 범주형 변수를 숫자 값으로 변환
df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])
다음 예에서는 다음 데이터 프레임에서 각 메서드를 사용하는 방법을 보여줍니다.
#create data frame with some categorical variables df <- data. frame (team=as. factor (c('A', 'B', 'C', 'D')), conf=as. factor (c('AL', 'AL', 'NL', 'NL')), win=as. factor (c('Yes', 'No', 'No', 'Yes')), dots=c(122, 98, 106, 115)) #view data frame df team conf win points 1 A AL Yes 122 2 B AL No 98 3 C NL No 106 4 D NL Yes 115
방법 1: 범주형 변수를 숫자로 변환
다음 코드는 데이터 프레임의 범주형 변수를 숫자 변수로 변환하는 방법을 보여줍니다.
#convert 'team' variable to numeric
df$team <- unclass(df$team)
#view updated data frame
df
team conf win points
1 1 AL Yes 122
2 2 AL No. 98
3 3 NL No 106
4 4 NL Yes 115
참고로 ‘팀’ 변수의 값은 숫자값으로 변환되었습니다.
방법 2: 여러 범주형 변수를 숫자 값으로 변환
다음 코드는 데이터 프레임의 여러 범주형 변수를 숫자 변수로 변환하는 방법을 보여줍니다.
#convert 'team' and 'win' variables to numeric
df[, c(' team ', ' win ')] <- sapply(df[, c(' team ', ' win ')], unclass)
#view updated data frame
df
team conf win points
1 1 AL 2 122
2 2 AL 1 98
3 3 NL 1,106
4 4 NL 2 115
참고로 ‘팀’, ‘승리’ 변수의 값은 수치로 변환되었습니다.
방법 3: 모든 범주형 변수를 숫자 값으로 변환
다음 코드는 데이터 프레임의 모든 범주형 변수를 숫자 변수로 변환하는 방법을 보여줍니다.
#convert all categorical variables to numeric
df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])
#view updated data frame
df
team conf win points
1 1 1 2 122
2 2 1 1 98
3 3 2 1 106
4 4 2 2 115
데이터 프레임의 각 범주형 변수의 값은 숫자 값으로 변환되었습니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 변환을 수행하는 방법을 설명합니다.