Na's vervangen door strings in r (met voorbeelden)
U kunt de functie Replace_na() uit het Tidyr- pakket gebruiken om NA’s te vervangen door specifieke strings in een kolom van een dataframe in R:
#replace NA values in column x with "missing"
df$x %>% replace_na (' none ')
U kunt deze functie ook gebruiken om NA’s te vervangen door specifieke tekenreeksen in meerdere kolommen van een dataframe:
#replace NA values in column x with "missing" and NA values in column y with "none" df %>% replace_na (list(x = ' missing ', y = ' none '))
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: NA’s vervangen door tekenreeksen in een kolom
De volgende code laat zien hoe u NA’s vervangt door een specifieke tekenreeks in een kolom van een dataframe:
library (tidyr)
df <- data. frame (status=c('single', 'married', 'married', NA),
education=c('Assoc', 'Bach', NA, 'Master'),
income=c(34, 88, 92, 90))
#view data frame
df
status education income
1 single Assoc 34
2 married Bach 88
3 married <NA> 92
4 <NA> Master 90
#replace missing values with 'single' in status column
df$status <- df$status %>% replace_na (' single ')
#view updated data frame
df
status education income
1 single Assoc 34
2 married Bach 88
3 married <NA> 92
4 single Master 90
Voorbeeld 2: NA’s vervangen door tekenreeksen in meerdere kolommen
De volgende code laat zien hoe u NA’s vervangt door een specifieke tekenreeks in meerdere kolommen van een dataframe:
library (tidyr)
df <- data. frame (status=c('single', 'married', 'married', NA),
education=c('Assoc', 'Bach', NA, 'Master'),
income=c(34, 88, 92, 90))
#view data frame
df
status education income
1 single Assoc 34
2 married Bach 88
3 married <NA> 92
4 <NA> Master 90
#replace missing values with 'single' in status column
df <- df %>% replace_na (list(status = ' single ', education = ' none '))
#view updated data frame
df
status education income
1 single Assoc 34
2 married Bach 88
3 married none 92
4 single Master 90
Aanvullende bronnen
Rijen verwijderen met enkele of alle NA’s in R
Hoe NA te vervangen door Zero in dplyr