Come eseguire l'analisi univariata in r (con esempi)
Il termine analisi univariata si riferisce all’analisi di una variabile. Puoi ricordarlo perché il prefisso “uni” significa “uno”.
Esistono tre modi comuni per eseguire l’analisi univariata su una variabile:
1. Statistiche riassuntive : misura il centro e la distribuzione dei valori.
2. Tabella delle frequenze : descrive la frequenza con cui compaiono valori diversi.
3. Grafici – Utilizzati per visualizzare la distribuzione dei valori.
Questo tutorial fornisce un esempio di come eseguire l’analisi univariata per la seguente variabile:
#create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)
Statistiche riassuntive
Possiamo utilizzare la seguente sintassi per calcolare varie statistiche riassuntive per la nostra variabile:
#find means mean(x) [1] 5.706667 #find median median(x) [1] 5 #find range max(x) - min(x) [1] 13.2 #find interquartile range (spread of middle 50% of values) IQR(x) [1] 3.45 #find standard deviation sd(x) [1] 3.858287
Tabella delle frequenze
Possiamo usare la seguente sintassi per produrre una tabella di frequenza per la nostra variabile:
#produce frequency table
table(s)
1 2 3.5 4 5 6.5 7 7.4 8 13 14.2
2 1 1 3 2 1 1 1 1 1 1
Questo ci dice che:
- Il valore 1 appare due volte
- Il valore 2 appare 1 volta
- Il valore 3,5 appare 1 volta
E così via.
Grafica
Possiamo produrre un boxplot utilizzando la seguente sintassi:
#produce boxplot
boxplot(x)
Possiamo produrre un istogramma utilizzando la seguente sintassi:
#produce histogram
hist(x)
Possiamo produrre una curva di densità utilizzando la seguente sintassi:
#produce density curve
plot(density(x))
Ciascuno di questi grafici ci offre un modo unico di visualizzare la distribuzione dei valori della nostra variabile.
Puoi trovare altri tutorial su R in questa pagina .