Como calcular o coeficiente de variação em python


Um coeficiente de variação , muitas vezes abreviado para CV , é uma forma de medir a dispersão dos valores em um conjunto de dados em relação à média. É calculado da seguinte forma:

CV=σ/μ

Ouro:

  • σ: o desvio padrão do conjunto de dados
  • μ: a média do conjunto de dados

Simplificando, o coeficiente de variação é simplesmente a razão entre o desvio padrão e a média.

Quando usar o coeficiente de variação

O coeficiente de variação é frequentemente usado para comparar a variação entre dois conjuntos diferentes de dados.

No mundo real, é frequentemente utilizado em finanças para comparar o retorno médio esperado de um investimento com o desvio padrão esperado do investimento. Isso permite que os investidores comparem a compensação risco-retorno entre os investimentos.

Por exemplo, suponha que um investidor esteja pensando em investir nos dois fundos mútuos a seguir:

Fundo Mútuo A: média = 9%, desvio padrão = 12,4%

OICVM B: média = 5%, desvio padrão = 8,2%

Ao calcular o coeficiente de variação de cada fundo, o investidor observa:

CV para fundo mútuo A = 12,4% /9% = 1,38

CV para fundo mútuo B = 8,2% / 5% = 1,64

Como o Fundo Mútuo A tem um coeficiente de variação mais baixo, proporciona um melhor retorno médio em relação ao desvio padrão.

Como calcular o coeficiente de variação em Python

Para calcular o coeficiente de variação de um conjunto de dados em Python, você pode usar a seguinte sintaxe:

 import numpy as np

cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100

Os exemplos a seguir mostram como usar essa sintaxe na prática.

Exemplo 1: Coeficiente de variação para uma única rede

O código a seguir mostra como calcular o CV para uma única tabela:

 #create vector of data
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82]

#define function to calculate cv
cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100 

#calculate CV
cv(data)

9.234518

O coeficiente de variação acaba sendo 9,23 .

Exemplo 2: Coeficiente de variação para vários vetores

O código a seguir mostra como calcular o CV de múltiplas colunas em um DataFrame do pandas:

 import numpy as np
import pandas as pd

#define function to calculate cv
cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100

#create pandas DataFrame
df = pd. DataFrame ({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95],
                   'b': [77, 88, 85, 76, 81, 82, 88, 91, 92, 99],
                   'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, 84]})

#calculate CV for each column in data frame
df. apply (cv)

a 11.012892
b8.330843
c7.154009
dtype:float64

Observe que os valores ausentes serão simplesmente ignorados ao calcular o coeficiente de variação:

 import numpy as np
import pandas as pd

#define function to calculate cv
cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100

#create pandas DataFrame
df = pd. DataFrame ({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95],
                   'b': [77, 88, 85, 76, 81, 82, 88, 91, np. no , 99],
                   'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, np. no ]})

#calculate CV for each column in data frame
df. apply (cv)

a 11.012892
b 8.497612
c5.860924
dtype:float64

Recursos adicionais

Como calcular o coeficiente de variação de R
Como calcular o coeficiente de variação no Excel
Como calcular o coeficiente de variação no Planilhas Google

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *