Come creare una tabella di frequenza di più variabili in r
Per calcolare una tabella di frequenza per più variabili in un frame di dati in R, puoi utilizzare la funzione apply() , che utilizza la seguente sintassi:
applica (X, MARGINE DIVERTENTE)
Oro:
- X: un array, matrice o blocco di dati
- MARGINE: applica una funzione su righe (1) o colonne (2)
- DIVERTIMENTO: la funzione da applicare
Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica.
Esempio 1: tabella di frequenza per tutte le variabili in R
Il codice seguente mostra come calcolare una tabella di frequenza per ciascuna variabile in un frame di dati:
#create data frame df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #view first few rows of data frame head(df) var1 var2 var3 1 1 To 6 2 1 A 7 3 2 To 7 4 2 To 7 5 2 B 8 6 2 B 8 #calculate frequency table for every variable in data frame apply((df), 2, table) $var1 1 2 3 2 4 1 $var2 AB 4 3 $var3 6 7 8 9 1 3 2 1
Il risultato sono tre tabelle di frequenza, una per ciascuna variabile nel frame di dati.
Ecco come interpretare la prima tabella delle frequenze:
- Il valore 1 appare due volte nella colonna “var1”.
- Il valore 2 appare 4 volte nella colonna “var2”.
- Il valore 3 appare 1 volta nella colonna “var3”.
Le altre tabelle di frequenza possono essere interpretate allo stesso modo.
Esempio 2: tabella di frequenza per variabili specifiche in R
Il codice seguente mostra come calcolare una tabella di frequenza per variabili specifiche in un frame di dati
#create data frame df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for var1 and var3 columns apply((df[c(' var1 ', ' var3 ')]), 2, table) $var1 1 2 3 2 4 1 $var3 6 7 8 9 1 3 2 1
Esempio 3: tabella di frequenza per tutte le variabili tranne una in R
Supponiamo di avere una colonna dell’indice in un frame di dati e di voler calcolare una tabella di frequenza per ciascuna variabile nel frame di dati tranne la colonna dell’indice.
Il codice seguente mostra come eseguire questa operazione:
#create data frame df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for all columns except index column apply((df[-1]), 2, table) $var2 AB 4 3 $var3 6 7 8 9 1 3 2 1
Risorse addizionali
Come creare una tabella a due vie in R
Come creare un istogramma di frequenza relativo in R