Come creare una tabella di contingenza in r


Una tabella di contingenza (a volte chiamata “tabelle incrociate”) è un tipo di tabella che riepiloga la relazione tra due variabili categoriali.

Fortunatamente, è facile creare una tabella di contingenza per le variabili in R utilizzando la funzione tabella pivot. Questo tutorial mostra un esempio di come eseguire questa operazione.

Esempio: tabella di contingenza in R

Supponiamo di avere il seguente set di dati che visualizza informazioni su 20 diversi ordini di prodotti, incluso il tipo di prodotto acquistato e il paese in cui è stato acquistato il prodotto:

 #create data
df <- data.frame(order_num = 1:20,
                 product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)),
                 country= rep (c(' A ', ' B ', ' C ', ' D '), times =5))

#view data
df

   order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

Per creare una tabella di contingenza, possiamo semplicemente utilizzare la funzione table() e fornire le variabili prodotto e paese come argomenti:

 #create contingency table
table <- table(df$product, df$country)

#view contingency table
table

           ABCD
  Computer 1 1 1 2
  Radio 1 2 2 1
  TV 3 2 2 2

Possiamo anche usare la funzione addmargins() per aggiungere margini alla tabella:

 #add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

            ABCD Sum
  Computer 1 1 1 2 5
  Radio 1 2 2 1 6
  TV 3 2 2 2 9
  Sum 5 5 5 5 20

Ecco come interpretare la tabella:

  • Il valore in basso a destra indica il numero totale di prodotti ordinati: 20.
  • I valori sul lato destro mostrano le somme delle righe: in totale sono stati ordinati 5 computer, 6 radio e 9 televisori.
  • I valori in fondo alla tabella mostrano le somme delle colonne: in totale sono stati ordinati 5 prodotti nel paese A, 5 nel paese B, 5 nel paese C e 5 nel paese D.
  • I valori all’interno della tabella indicano il numero di prodotti specifici ordinati in ciascun paese: 1 computer dal paese A, 1 radio dal paese A, 3 televisori dal paese A, ecc.

Risorse addizionali

Come calcolare la media sulle colonne in R
Come sommare colonne specifiche in R
Come calcolare la media di più colonne in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *