Come creare una tabella e includere valori na in r


Per impostazione predefinita, la funzione table() in R crea una tabella di valori di frequenza ma non include la frequenza dei valori NA.

Tuttavia, puoi utilizzare i seguenti metodi per creare una tabella e includere valori NA:

Metodo 1: crea una tabella e mostra sempre il numero di valori NA

 table(df$my_column, useNA = " always ")

Metodo 2: crea una tabella e visualizza solo il numero di valori NA, se presenti

 table(df$my_column, useNA = " ifany ")

Gli esempi seguenti mostrano come utilizzare ciascun metodo nella pratica.

Esempio 1: crea una tabella e visualizza sempre il numero di valori NA

Supponiamo di avere il seguente frame di dati in R che contiene informazioni su vari giocatori di basket:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(20, 25, 14, 18, 19, 12, 12, 15))

#view data frame
df

  team points
1 to 20
2 to 25
3 to 14
4 to 18
5 B 19
6 B 12
7 B 12
8 B 15

Possiamo utilizzare la seguente sintassi per creare una tabella della frequenza dei valori nella colonna della squadra e visualizzare il numero di valori NA indipendentemente dal fatto che esistano o meno:

 #create frequency table of values in team column, including NA values
table(df$team, useNA = " always ")

   AB <NA>
   4 4 0 

Si noti che la tabella risultante mostra che ci sono 0 valori NA nella colonna squadra del frame di dati.

Poiché abbiamo utilizzato l’argomento useNA = “always” , la tabella mostrava comunque il numero di valori NA anche se non ce n’erano.

Esempio 2: crea una tabella e visualizza solo il numero di valori NA, se presenti

Supponiamo ancora di avere il seguente frame di dati in R che contiene informazioni su vari giocatori di basket:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(20, 25, 14, 18, 19, 12, 12, 15))

#view data frame
df

  team points
1 to 20
2 to 25
3 to 14
4 to 18
5 B 19
6 B 12
7 B 12
8 B 15

Possiamo utilizzare la seguente sintassi per creare una tabella per la frequenza dei valori nella colonna del team e visualizzare solo il numero di valori NA, se presenti:

 #create frequency table of values in team column, including NA values if any exist
table(df$team, useNA = " ifany ")

AB
4 4

Tieni presente che la tabella risultante mostra la frequenza dei valori “A” e “B” nella colonna della squadra , ma non mostra la frequenza dei valori NA poiché non ce ne sono.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni in R:

Come creare una tabella a due vie in R
Come convertire un array in matrice in R
Come convertire una tabella in un frame di dati in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *