A: come utilizzare drop_na per eliminare le righe con valori mancanti
Puoi utilizzare la funzione drop_na() del pacchetto Tidyr in R per eliminare le righe con valori mancanti in un frame di dati.
Esistono tre modi comuni per utilizzare questa funzionalità:
Metodo 1: rimuovi le righe con valori mancanti in qualsiasi colonna
df %>% drop_na()
Metodo 2: rimuovi le righe con valori mancanti in una colonna specifica
df %>% drop_na(col1)
Metodo 3: rimuovi le righe con valori mancanti in una delle numerose colonne specifiche
df %>% drop_na(c(col1, col2))
I seguenti esempi mostrano come utilizzare nella pratica ciascuno di questi metodi con il seguente frame di dati:
#create data frame df <- data. frame (points=c(10, NA, 15, 15, 14, 16), assists=c(4, NA, 4, NA, 9, 3), rebounds=c(NA, 5, 10, 7, 7, NA)) #view data frame df points assists rebounds 1 10 4 NA 2 NA NA 5 3 15 4 10 4 15 NA 7 5 14 9 7 6 16 3 NA
Esempio 1: elimina le righe con valori mancanti in qualsiasi colonna
Il codice seguente mostra come utilizzare drop_na() per eliminare righe con valori mancanti in qualsiasi colonna:
library (tidyr)
#drop rows with missing values in any column
df %>% drop_na()
points assists rebounds
1 15 4 10
2 14 9 7
Le uniche righe rimanenti sono quelle che non contengono valori mancanti in nessuna colonna.
Esempio 2: rimuovere le righe con valori mancanti in una colonna specifica
Il codice seguente mostra come utilizzare drop_na() per rimuovere le righe con valori mancanti nella colonna dei rimbalzi :
library (tidyr)
#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)
points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7
Le uniche righe rimanenti sono quelle senza valori mancanti nella colonna dei rimbalzi .
Esempio 3: eliminare le righe con valori mancanti in una delle numerose colonne specifiche
Il codice seguente mostra come utilizzare drop_na() per eliminare righe con valori mancanti nelle colonne punti o assist :
library (tidyr)
#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))
points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA
Le uniche righe rimanenti sono quelle senza valori mancanti nelle colonne dei punti o degli assist .
Nota: puoi trovare la documentazione online completa per il metodo drop_na() qui .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come recuperare i numeri di riga in R
Come aggiungere righe a un frame di dati in R
Come applicare una funzione a ciascuna riga del frame di dati in R