Come calcolare il coefficiente di variazione di r
Un coefficiente di variazione , spesso abbreviato in CV , è un modo per misurare la diffusione dei valori in un set di dati rispetto alla media. Viene calcolato come segue:
CV = σ/μ
Oro:
- σ: la deviazione standard del set di dati
- μ: la media del set di dati
In poche parole, il coefficiente di variazione è semplicemente il rapporto tra la deviazione standard e la media.
Quando utilizzare il coefficiente di variazione
Il coefficiente di variazione viene spesso utilizzato per confrontare la variazione tra due diversi insiemi di dati.
Nel mondo reale, viene spesso utilizzato in finanza per confrontare il rendimento medio atteso di un investimento con la deviazione standard attesa dell’investimento. Ciò consente agli investitori di confrontare il compromesso rischio-rendimento tra gli investimenti.
Ad esempio, supponiamo che un investitore stia valutando di investire nei seguenti due fondi comuni di investimento:
Fondo comune A: media = 9%, deviazione standard = 12,4%
OICVM B: media = 5%, deviazione standard = 8,2%
Calcolando il coefficiente di variazione di ciascun fondo, l’investitore rileva:
CV del fondo comune A = 12,4% /9% = 1,38
CV del fondo comune B = 8,2% / 5% = 1,64
Poiché il Fondo comune A ha un coefficiente di variazione inferiore, fornisce un rendimento medio migliore rispetto alla deviazione standard.
Come calcolare il coefficiente di variazione di R
Per calcolare il coefficiente di variazione di un set di dati in R, è possibile utilizzare la seguente sintassi:
cv <- sd(data) / mean(data) * 100
Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica.
Esempio 1: coefficiente di variazione per un singolo vettore
Il codice seguente mostra come calcolare il CV per un singolo vettore:
#create vector of data data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82) #calculate CV cv <- sd(data) / mean(data) * 100 #display CV resume [1] 9.234518
Il coefficiente di variazione risulta essere 9,23 .
Esempio 2: coefficiente di variazione per più vettori
Il codice seguente mostra come calcolare il CV di più vettori in un frame di dati utilizzando la funzione sapply() :
#create data frame data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99), c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84)) #calculate CV for each column in data frame sapply(data, function (x) sd(x) / mean(x) * 100 ) ABC 11.012892 8.330843 7.154009
Assicurati di utilizzare na.rm=T se anche nei tuoi dati mancano dei valori. Questo dice a R di ignorare semplicemente i valori mancanti durante il calcolo del coefficiente di variazione:
#create data frame data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b=c(77, 88, 85, 76, 81, 82, 88, 91, NA , 99), c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA )) #calculate CV for each column in data frame sapply(data, function (x) sd(x, na.rm= T ) / mean(x, na.rm= T ) * 100 ) ABC 11.012892 8.497612 5.860924
Risorse addizionali
Come calcolare la deviazione mediana assoluta in R
Come calcolare la deviazione standard in R
Come trovare l’intervallo in R