Hoe categorische variabelen naar numeriek te converteren in r


U kunt een van de volgende methoden gebruiken om een categorische variabele naar een numerieke variabele in R te converteren:

Methode 1: Converteer een categorische variabele naar numeriek

 df$var1 <- unclass(df$var1)

Methode 2: Converteer meerdere categorische variabelen naar numerieke waarden

 df[, c(' var1 ', ' var2 ')] <- sapply(df[, c(' var1 ', ' var2 ')], unclass)

Methode 3: Converteer alle categorische variabelen naar numerieke waarden

 df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met het volgende dataframe:

 #create data frame with some categorical variables
df <- data. frame (team=as. factor (c('A', 'B', 'C', 'D')),
                 conf=as. factor (c('AL', 'AL', 'NL', 'NL')),
                 win=as. factor (c('Yes', 'No', 'No', 'Yes')),
                 dots=c(122, 98, 106, 115))

#view data frame
df

  team conf win points
1 A AL Yes 122
2 B AL No 98
3 C NL No 106
4 D NL Yes 115

Methode 1: Converteer een categorische variabele naar numeriek

De volgende code laat zien hoe u een categorische variabele in een dataframe converteert naar een numerieke variabele:

 #convert 'team' variable to numeric
df$team <- unclass(df$team)

#view updated data frame
df

  team conf win points
1 1 AL Yes 122
2 2 AL No. 98
3 3 NL No 106
4 4 NL Yes 115

Merk op dat de waarden van de variabele “team” zijn omgezet naar numerieke waarden.

Methode 2: Converteer meerdere categorische variabelen naar numerieke waarden

De volgende code laat zien hoe u meerdere categorische variabelen in een dataframe converteert naar numerieke variabelen:

 #convert 'team' and 'win' variables to numeric
df[, c(' team ', ' win ')] <- sapply(df[, c(' team ', ' win ')], unclass)

#view updated data frame
df

  team conf win points
1 1 AL 2 122
2 2 AL 1 98
3 3 NL 1,106
4 4 NL 2 115

Merk op dat de waarden van de variabelen “team” en “win” zijn omgezet naar numerieke waarden.

Methode 3: Converteer alle categorische variabelen naar numerieke waarden

De volgende code laat zien hoe u alle categorische variabelen in een dataframe naar numerieke variabelen converteert:

 #convert all categorical variables to numeric
df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])

#view updated data frame
df

  team conf win points
1 1 1 2 122
2 2 1 1 98
3 3 2 1 106
4 4 2 2 115

Merk op dat de waarden van elk van de categorische variabelen in het dataframe zijn omgezet naar numerieke waarden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende conversies in R kunt uitvoeren:

Hoe een datum naar numeriek in R te converteren
Hoe een teken naar een factor in R te converteren
Hoe factor naar karakter te converteren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert