Come rimuovere colonne con valori na in r
È possibile utilizzare uno dei due metodi per rimuovere colonne da un frame di dati in R che contengono valori NA:
Metodo 1: utilizzare Base R
df[, colSums(is. na (df))== 0 ]
Metodo 2: usa dplyr
library (dplyr) df %>% select_if(~ !any(is. na (.)))
Entrambi i metodi producono lo stesso risultato.
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
points=c(99, NA, NA, 88, 95),
assists=c(33, 28, 31, 39, 34),
rebounds=c(30, 28, 24, 24, NA))
#view data frame
df
team points assists rebounds
1 A 99 33 30
2 B NA 28 28
3 C NA 31 24
4 D 88 39 24
5 E 95 34 NA
Esempio 1: rimuovere colonne con valori NA utilizzando la base R
Il codice seguente mostra come eliminare colonne con valori NA utilizzando le funzioni R di base:
#define new data frame new_df <- df[ , colSums(is. na (df))== 0 ] #view new data frame new_df team assists 1 to 33 2 B 28 3 C 31 4 D 39 5 E 34
Da notare che le due colonne con i valori NA (punti e rimbalzi) sono state entrambe rimosse dal data frame.
Esempio 2: rimuovere le colonne con valori NA utilizzando dplyr
Il codice seguente mostra come rimuovere colonne con valori NA utilizzando le funzioni nel pacchetto dplyr :
library (dplyr)
#define new data frame
new_df <- df %>% select_if(~ !any(is. na (.)))
#view new data frame
new_df
team assists
1 to 33
2 B 28
3 C 31
4 D 39
5 E 34
Anche in questo caso, le due colonne con i valori NA (punti e rimbalzi) sono state entrambe rimosse dal data frame.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come aggiungere una colonna a un frame di dati in R
Come rinominare le colonne del frame di dati in R
Come ordinare un frame di dati per colonna in R