Come creare una tabella e includere valori na in r
Per impostazione predefinita, la funzione table() in R crea una tabella di valori di frequenza ma non include la frequenza dei valori NA.
Tuttavia, puoi utilizzare i seguenti metodi per creare una tabella e includere valori NA:
Metodo 1: crea una tabella e mostra sempre il numero di valori NA
table(df$my_column, useNA = " always ")
Metodo 2: crea una tabella e visualizza solo il numero di valori NA, se presenti
table(df$my_column, useNA = " ifany ")
Gli esempi seguenti mostrano come utilizzare ciascun metodo nella pratica.
Esempio 1: crea una tabella e visualizza sempre il numero di valori NA
Supponiamo di avere il seguente frame di dati in R che contiene informazioni su vari giocatori di basket:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(20, 25, 14, 18, 19, 12, 12, 15))
#view data frame
df
team points
1 to 20
2 to 25
3 to 14
4 to 18
5 B 19
6 B 12
7 B 12
8 B 15
Possiamo utilizzare la seguente sintassi per creare una tabella della frequenza dei valori nella colonna della squadra e visualizzare il numero di valori NA indipendentemente dal fatto che esistano o meno:
#create frequency table of values in team column, including NA values
table(df$team, useNA = " always ")
AB <NA>
4 4 0
Si noti che la tabella risultante mostra che ci sono 0 valori NA nella colonna squadra del frame di dati.
Poiché abbiamo utilizzato l’argomento useNA = “always” , la tabella mostrava comunque il numero di valori NA anche se non ce n’erano.
Esempio 2: crea una tabella e visualizza solo il numero di valori NA, se presenti
Supponiamo ancora di avere il seguente frame di dati in R che contiene informazioni su vari giocatori di basket:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(20, 25, 14, 18, 19, 12, 12, 15))
#view data frame
df
team points
1 to 20
2 to 25
3 to 14
4 to 18
5 B 19
6 B 12
7 B 12
8 B 15
Possiamo utilizzare la seguente sintassi per creare una tabella per la frequenza dei valori nella colonna del team e visualizzare solo il numero di valori NA, se presenti:
#create frequency table of values in team column, including NA values if any exist
table(df$team, useNA = " ifany ")
AB
4 4
Tieni presente che la tabella risultante mostra la frequenza dei valori “A” e “B” nella colonna della squadra , ma non mostra la frequenza dei valori NA poiché non ce ne sono.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni in R:
Come creare una tabella a due vie in R
Come convertire un array in matrice in R
Come convertire una tabella in un frame di dati in R