Как преобразовать категориальные переменные в числовые в r


Вы можете использовать любой из следующих методов для преобразования категориальной переменной в числовую переменную в R:

Метод 1: преобразовать категориальную переменную в числовую

 df$var1 <- unclass(df$var1)

Метод 2: преобразование нескольких категориальных переменных в числовые значения

 df[, c(' var1 ', ' var2 ')] <- sapply(df[, c(' var1 ', ' var2 ')], unclass)

Метод 3: преобразовать все категориальные переменные в числовые значения

 df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])

В следующих примерах показано, как использовать каждый метод со следующим фреймом данных:

 #create data frame with some categorical variables
df <- data. frame (team=as. factor (c('A', 'B', 'C', 'D')),
                 conf=as. factor (c('AL', 'AL', 'NL', 'NL')),
                 win=as. factor (c('Yes', 'No', 'No', 'Yes')),
                 dots=c(122, 98, 106, 115))

#view data frame
df

  team conf win points
1 A AL Yes 122
2 B AL No 98
3 C NL No 106
4 D NL Yes 115

Метод 1: преобразовать категориальную переменную в числовую

Следующий код показывает, как преобразовать категориальную переменную во фрейме данных в числовую переменную:

 #convert 'team' variable to numeric
df$team <- unclass(df$team)

#view updated data frame
df

  team conf win points
1 1 AL Yes 122
2 2 AL No. 98
3 3 NL No 106
4 4 NL Yes 115

Обратите внимание, что значения переменной «команда» были преобразованы в числовые значения.

Метод 2: преобразование нескольких категориальных переменных в числовые значения

Следующий код показывает, как преобразовать несколько категориальных переменных в фрейме данных в числовые переменные:

 #convert 'team' and 'win' variables to numeric
df[, c(' team ', ' win ')] <- sapply(df[, c(' team ', ' win ')], unclass)

#view updated data frame
df

  team conf win points
1 1 AL 2 122
2 2 AL 1 98
3 3 NL 1,106
4 4 NL 2 115

Обратите внимание, что значения переменных «команда» и «победа» были преобразованы в числовые значения.

Метод 3: преобразовать все категориальные переменные в числовые значения

Следующий код показывает, как преобразовать все категориальные переменные во фрейме данных в числовые переменные:

 #convert all categorical variables to numeric
df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])

#view updated data frame
df

  team conf win points
1 1 1 2 122
2 2 1 1 98
3 3 2 1 106
4 4 2 2 115

Обратите внимание, что значения каждой категориальной переменной во фрейме данных были преобразованы в числовые значения.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные преобразования в R:

Как преобразовать дату в числовое значение в R
Как преобразовать символ в фактор в R
Как преобразовать фактор в символ в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *