Jak przekonwertować zmienne kategoryczne na numeryczne w r


Do konwersji zmiennej jakościowej na zmienną numeryczną w języku R można użyć dowolnej z następujących metod:

Metoda 1: Konwertuj zmienną jakościową na numeryczną

 df$var1 <- unclass(df$var1)

Metoda 2: Konwersja wielu zmiennych jakościowych na wartości liczbowe

 df[, c(' var1 ', ' var2 ')] <- sapply(df[, c(' var1 ', ' var2 ')], unclass)

Metoda 3: Konwertuj wszystkie zmienne jakościowe na wartości liczbowe

 df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])

Poniższe przykłady pokazują, jak używać każdej metody z następującą ramką danych:

 #create data frame with some categorical variables
df <- data. frame (team=as. factor (c('A', 'B', 'C', 'D')),
                 conf=as. factor (c('AL', 'AL', 'NL', 'NL')),
                 win=as. factor (c('Yes', 'No', 'No', 'Yes')),
                 dots=c(122, 98, 106, 115))

#view data frame
df

  team conf win points
1 A AL Yes 122
2 B AL No 98
3 C NL No 106
4 D NL Yes 115

Metoda 1: Konwertuj zmienną jakościową na numeryczną

Poniższy kod pokazuje, jak przekonwertować zmienną jakościową w ramce danych na zmienną numeryczną:

 #convert 'team' variable to numeric
df$team <- unclass(df$team)

#view updated data frame
df

  team conf win points
1 1 AL Yes 122
2 2 AL No. 98
3 3 NL No 106
4 4 NL Yes 115

Należy pamiętać, że wartości zmiennej „zespół” zostały przeliczone na wartości liczbowe.

Metoda 2: Konwersja wielu zmiennych jakościowych na wartości liczbowe

Poniższy kod pokazuje, jak konwertować wiele zmiennych kategorialnych w ramce danych na zmienne numeryczne:

 #convert 'team' and 'win' variables to numeric
df[, c(' team ', ' win ')] <- sapply(df[, c(' team ', ' win ')], unclass)

#view updated data frame
df

  team conf win points
1 1 AL 2 122
2 2 AL 1 98
3 3 NL 1,106
4 4 NL 2 115

Należy pamiętać, że wartości zmiennych „zespół” i „wygrana” zostały przeliczone na wartości liczbowe.

Metoda 3: Konwertuj wszystkie zmienne jakościowe na wartości liczbowe

Poniższy kod pokazuje, jak przekonwertować wszystkie zmienne jakościowe w ramce danych na zmienne numeryczne:

 #convert all categorical variables to numeric
df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])

#view updated data frame
df

  team conf win points
1 1 1 2 122
2 2 1 1 98
3 3 2 1 106
4 4 2 2 115

Należy pamiętać, że wartości każdej ze zmiennych kategorycznych w ramce danych zostały przekonwertowane na wartości liczbowe.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonać inne typowe konwersje w R:

Jak przekonwertować datę na liczbę w R
Jak przekonwertować znak na współczynnik w R
Jak przekonwertować współczynnik na znak w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *