Come sostituire le na con stringhe in r (con esempi)
Puoi utilizzare la funzione replace_na() dal pacchetto Tidyr per sostituire NA con stringhe specifiche in una colonna di un frame di dati in R:
#replace NA values in column x with "missing"
df$x %>% replace_na (' none ')
Puoi anche utilizzare questa funzione per sostituire NA con stringhe specifiche in più colonne di un frame di dati:
#replace NA values in column x with "missing" and NA values in column y with "none" df %>% replace_na (list(x = ' missing ', y = ' none '))
I seguenti esempi mostrano come utilizzare questa funzione nella pratica.
Esempio 1: sostituire le NA con stringhe in una colonna
Il codice seguente mostra come sostituire gli NA con una stringa specifica in una colonna di un frame di dati:
library (tidyr)
df <- data. frame (status=c('single', 'married', 'married', NA),
education=c('Assoc', 'Bach', NA, 'Master'),
income=c(34, 88, 92, 90))
#view data frame
df
status education income
1 single Assoc 34
2 married Bach 88
3 married <NA> 92
4 <NA> Master 90
#replace missing values with 'single' in status column
df$status <- df$status %>% replace_na (' single ')
#view updated data frame
df
status education income
1 single Assoc 34
2 married Bach 88
3 married <NA> 92
4 single Master 90
Esempio 2: sostituire le NA con stringhe in più colonne
Il codice seguente mostra come sostituire gli NA con una stringa specifica in più colonne di un frame di dati:
library (tidyr)
df <- data. frame (status=c('single', 'married', 'married', NA),
education=c('Assoc', 'Bach', NA, 'Master'),
income=c(34, 88, 92, 90))
#view data frame
df
status education income
1 single Assoc 34
2 married Bach 88
3 married <NA> 92
4 <NA> Master 90
#replace missing values with 'single' in status column
df <- df %>% replace_na (list(status = ' single ', education = ' none '))
#view updated data frame
df
status education income
1 single Assoc 34
2 married Bach 88
3 married none 92
4 single Master 90
Risorse addizionali
Come eliminare righe con alcune o tutte le NA in R
Come sostituire NA con Zero in dplyr