A: come utilizzare drop_na per eliminare le righe con valori mancanti


Puoi utilizzare la funzione drop_na() del pacchetto Tidyr in R per eliminare le righe con valori mancanti in un frame di dati.

Esistono tre modi comuni per utilizzare questa funzionalità:

Metodo 1: rimuovi le righe con valori mancanti in qualsiasi colonna

 df %>% drop_na()

Metodo 2: rimuovi le righe con valori mancanti in una colonna specifica

 df %>% drop_na(col1)

Metodo 3: rimuovi le righe con valori mancanti in una delle numerose colonne specifiche

 df %>% drop_na(c(col1, col2))

I seguenti esempi mostrano come utilizzare nella pratica ciascuno di questi metodi con il seguente frame di dati:

 #create data frame
df <- data. frame (points=c(10, NA, 15, 15, 14, 16),
                 assists=c(4, NA, 4, NA, 9, 3),
                 rebounds=c(NA, 5, 10, 7, 7, NA))

#view data frame
df

  points assists rebounds
1 10 4 NA
2 NA NA 5
3 15 4 10
4 15 NA 7
5 14 9 7
6 16 3 NA

Esempio 1: elimina le righe con valori mancanti in qualsiasi colonna

Il codice seguente mostra come utilizzare drop_na() per eliminare righe con valori mancanti in qualsiasi colonna:

 library (tidyr)

#drop rows with missing values in any column
df %>% drop_na()

  points assists rebounds
1 15 4 10
2 14 9 7

Le uniche righe rimanenti sono quelle che non contengono valori mancanti in nessuna colonna.

Esempio 2: rimuovere le righe con valori mancanti in una colonna specifica

Il codice seguente mostra come utilizzare drop_na() per rimuovere le righe con valori mancanti nella colonna dei rimbalzi :

 library (tidyr)

#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)

  points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7

Le uniche righe rimanenti sono quelle senza valori mancanti nella colonna dei rimbalzi .

Esempio 3: eliminare le righe con valori mancanti in una delle numerose colonne specifiche

Il codice seguente mostra come utilizzare drop_na() per eliminare righe con valori mancanti nelle colonne punti o assist :

 library (tidyr)

#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))

  points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA

Le uniche righe rimanenti sono quelle senza valori mancanti nelle colonne dei punti o degli assist .

Nota: puoi trovare la documentazione online completa per il metodo drop_na() qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come recuperare i numeri di riga in R
Come aggiungere righe a un frame di dati in R
Come applicare una funzione a ciascuna riga del frame di dati in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *