Come rimuovere colonne con valori na in r


È possibile utilizzare uno dei due metodi per rimuovere colonne da un frame di dati in R che contengono valori NA:

Metodo 1: utilizzare Base R

 df[, colSums(is. na (df))== 0 ]

Metodo 2: usa dplyr

 library (dplyr)

df %>% select_if(~ !any(is. na (.)))

Entrambi i metodi producono lo stesso risultato.

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, NA, NA, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B NA 28 28
3 C NA 31 24
4 D 88 39 24
5 E 95 34 NA

Esempio 1: rimuovere colonne con valori NA utilizzando la base R

Il codice seguente mostra come eliminare colonne con valori NA utilizzando le funzioni R di base:

 #define new data frame
new_df <- df[ , colSums(is. na (df))== 0 ]

#view new data frame
new_df

  team assists
1 to 33
2 B 28
3 C 31
4 D 39
5 E 34

Da notare che le due colonne con i valori NA (punti e rimbalzi) sono state entrambe rimosse dal data frame.

Esempio 2: rimuovere le colonne con valori NA utilizzando dplyr

Il codice seguente mostra come rimuovere colonne con valori NA utilizzando le funzioni nel pacchetto dplyr :

 library (dplyr)

#define new data frame
new_df <- df %>% select_if(~ !any(is. na (.)))

#view new data frame
new_df

  team assists
1 to 33
2 B 28
3 C 31
4 D 39
5 E 34

Anche in questo caso, le due colonne con i valori NA (punti e rimbalzi) sono state entrambe rimosse dal data frame.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come aggiungere una colonna a un frame di dati in R
Come rinominare le colonne del frame di dati in R
Come ordinare un frame di dati per colonna in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *