Come eseguire l'analisi univariata in r (con esempi)


Il termine analisi univariata si riferisce all’analisi di una variabile. Puoi ricordarlo perché il prefisso “uni” significa “uno”.

Esistono tre modi comuni per eseguire l’analisi univariata su una variabile:

1. Statistiche riassuntive : misura il centro e la distribuzione dei valori.

2. Tabella delle frequenze : descrive la frequenza con cui compaiono valori diversi.

3. Grafici – Utilizzati per visualizzare la distribuzione dei valori.

Questo tutorial fornisce un esempio di come eseguire l’analisi univariata per la seguente variabile:

 #create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)

Statistiche riassuntive

Possiamo utilizzare la seguente sintassi per calcolare varie statistiche riassuntive per la nostra variabile:

 #find means
mean(x)
[1] 5.706667

#find median
median(x)

[1] 5

#find range
max(x) - min(x)

[1] 13.2

#find interquartile range (spread of middle 50% of values)
IQR(x)

[1] 3.45

#find standard deviation
sd(x)

[1] 3.858287

Tabella delle frequenze

Possiamo usare la seguente sintassi per produrre una tabella di frequenza per la nostra variabile:

 #produce frequency table
table(s)

   1 2 3.5 4 5 6.5 7 7.4 8 13 14.2 
   2 1 1 3 2 1 1 1 1 1 1 

Questo ci dice che:

  • Il valore 1 appare due volte
  • Il valore 2 appare 1 volta
  • Il valore 3,5 appare 1 volta

E così via.

Grafica

Possiamo produrre un boxplot utilizzando la seguente sintassi:

 #produce boxplot
boxplot(x)

Possiamo produrre un istogramma utilizzando la seguente sintassi:

 #produce histogram
hist(x) 

Possiamo produrre una curva di densità utilizzando la seguente sintassi:

 #produce density curve
plot(density(x)) 

Ciascuno di questi grafici ci offre un modo unico di visualizzare la distribuzione dei valori della nostra variabile.


Puoi trovare altri tutorial su R in questa pagina .

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *