Como calcular o coeficiente de variação de r
Um coeficiente de variação , muitas vezes abreviado para CV , é uma forma de medir a dispersão dos valores em um conjunto de dados em relação à média. É calculado da seguinte forma:
CV=σ/μ
Ouro:
- σ: o desvio padrão do conjunto de dados
- μ: a média do conjunto de dados
Simplificando, o coeficiente de variação é simplesmente a razão entre o desvio padrão e a média.
Quando usar o coeficiente de variação
O coeficiente de variação é frequentemente usado para comparar a variação entre dois conjuntos diferentes de dados.
No mundo real, é frequentemente utilizado em finanças para comparar o retorno médio esperado de um investimento com o desvio padrão esperado do investimento. Isso permite que os investidores comparem a compensação risco-retorno entre os investimentos.
Por exemplo, suponha que um investidor esteja pensando em investir nos dois fundos mútuos a seguir:
Fundo Mútuo A: média = 9%, desvio padrão = 12,4%
OICVM B: média = 5%, desvio padrão = 8,2%
Ao calcular o coeficiente de variação de cada fundo, o investidor observa:
CV para fundo mútuo A = 12,4% /9% = 1,38
CV para fundo mútuo B = 8,2% / 5% = 1,64
Como o Fundo Mútuo A tem um coeficiente de variação mais baixo, proporciona um melhor retorno médio em relação ao desvio padrão.
Como calcular o coeficiente de variação de R
Para calcular o coeficiente de variação de um conjunto de dados em R, você pode usar a seguinte sintaxe:
cv <- sd(data) / mean(data) * 100
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplo 1: Coeficiente de variação para um único vetor
O código a seguir mostra como calcular o CV para um único vetor:
#create vector of data data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82) #calculate CV cv <- sd(data) / mean(data) * 100 #display CV resume [1] 9.234518
O coeficiente de variação acaba sendo 9,23 .
Exemplo 2: Coeficiente de variação para vários vetores
O código a seguir mostra como calcular o CV de vários vetores em um quadro de dados usando a função sapply() :
#create data frame data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99), c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84)) #calculate CV for each column in data frame sapply(data, function (x) sd(x) / mean(x) * 100 ) ABC 11.012892 8.330843 7.154009
Certifique-se de usar na.rm=T se seus dados também estiverem faltando valores. Isso diz a R para simplesmente ignorar os valores ausentes ao calcular o coeficiente de variação:
#create data frame data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b=c(77, 88, 85, 76, 81, 82, 88, 91, NA , 99), c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA )) #calculate CV for each column in data frame sapply(data, function (x) sd(x, na.rm= T ) / mean(x, na.rm= T ) * 100 ) ABC 11.012892 8.497612 5.860924
Recursos adicionais
Como calcular o desvio mediano absoluto em R
Como calcular o desvio padrão em R
Como encontrar o intervalo em R