Hoe categorische variabelen naar numeriek te converteren in r
U kunt een van de volgende methoden gebruiken om een categorische variabele naar een numerieke variabele in R te converteren:
Methode 1: Converteer een categorische variabele naar numeriek
df$var1 <- unclass(df$var1)
Methode 2: Converteer meerdere categorische variabelen naar numerieke waarden
df[, c(' var1 ', ' var2 ')] <- sapply(df[, c(' var1 ', ' var2 ')], unclass)
Methode 3: Converteer alle categorische variabelen naar numerieke waarden
df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])
De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met het volgende dataframe:
#create data frame with some categorical variables df <- data. frame (team=as. factor (c('A', 'B', 'C', 'D')), conf=as. factor (c('AL', 'AL', 'NL', 'NL')), win=as. factor (c('Yes', 'No', 'No', 'Yes')), dots=c(122, 98, 106, 115)) #view data frame df team conf win points 1 A AL Yes 122 2 B AL No 98 3 C NL No 106 4 D NL Yes 115
Methode 1: Converteer een categorische variabele naar numeriek
De volgende code laat zien hoe u een categorische variabele in een dataframe converteert naar een numerieke variabele:
#convert 'team' variable to numeric
df$team <- unclass(df$team)
#view updated data frame
df
team conf win points
1 1 AL Yes 122
2 2 AL No. 98
3 3 NL No 106
4 4 NL Yes 115
Merk op dat de waarden van de variabele “team” zijn omgezet naar numerieke waarden.
Methode 2: Converteer meerdere categorische variabelen naar numerieke waarden
De volgende code laat zien hoe u meerdere categorische variabelen in een dataframe converteert naar numerieke variabelen:
#convert 'team' and 'win' variables to numeric
df[, c(' team ', ' win ')] <- sapply(df[, c(' team ', ' win ')], unclass)
#view updated data frame
df
team conf win points
1 1 AL 2 122
2 2 AL 1 98
3 3 NL 1,106
4 4 NL 2 115
Merk op dat de waarden van de variabelen “team” en “win” zijn omgezet naar numerieke waarden.
Methode 3: Converteer alle categorische variabelen naar numerieke waarden
De volgende code laat zien hoe u alle categorische variabelen in een dataframe naar numerieke variabelen converteert:
#convert all categorical variables to numeric
df[sapply(df, is. factor )] <- data. matrix (df[sapply(df, is.factor )])
#view updated data frame
df
team conf win points
1 1 1 2 122
2 2 1 1 98
3 3 2 1 106
4 4 2 2 115
Merk op dat de waarden van elk van de categorische variabelen in het dataframe zijn omgezet naar numerieke waarden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende conversies in R kunt uitvoeren:
Hoe een datum naar numeriek in R te converteren
Hoe een teken naar een factor in R te converteren
Hoe factor naar karakter te converteren in R