Come creare una tabella di frequenza di più variabili in r


Per calcolare una tabella di frequenza per più variabili in un frame di dati in R, puoi utilizzare la funzione apply() , che utilizza la seguente sintassi:

applica (X, MARGINE DIVERTENTE)

Oro:

  • X: un array, matrice o blocco di dati
  • MARGINE: applica una funzione su righe (1) o colonne (2)
  • DIVERTIMENTO: la funzione da applicare

Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica.

Esempio 1: tabella di frequenza per tutte le variabili in R

Il codice seguente mostra come calcolare una tabella di frequenza per ciascuna variabile in un frame di dati:

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#view first few rows of data frame
head(df)

  var1 var2 var3
1 1 To 6
2 1 A 7
3 2 To 7
4 2 To 7
5 2 B 8
6 2 B 8

#calculate frequency table for every variable in data frame
apply((df), 2, table)

$var1

1 2 3 
2 4 1 

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Il risultato sono tre tabelle di frequenza, una per ciascuna variabile nel frame di dati.

Ecco come interpretare la prima tabella delle frequenze:

  • Il valore 1 appare due volte nella colonna “var1”.
  • Il valore 2 appare 4 volte nella colonna “var2”.
  • Il valore 3 appare 1 volta nella colonna “var3”.

Le altre tabelle di frequenza possono essere interpretate allo stesso modo.

Esempio 2: tabella di frequenza per variabili specifiche in R

Il codice seguente mostra come calcolare una tabella di frequenza per variabili specifiche in un frame di dati

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for var1 and var3 columns
apply((df[c(' var1 ', ' var3 ')]), 2, table)

$var1

1 2 3 
2 4 1

$var3

6 7 8 9 
1 3 2 1

Esempio 3: tabella di frequenza per tutte le variabili tranne una in R

Supponiamo di avere una colonna dell’indice in un frame di dati e di voler calcolare una tabella di frequenza per ciascuna variabile nel frame di dati tranne la colonna dell’indice.

Il codice seguente mostra come eseguire questa operazione:

 #create data frame
df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for all columns except index column
apply((df[-1]), 2, table)

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Risorse addizionali

Come creare una tabella a due vie in R
Come creare un istogramma di frequenza relativo in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *