Como calcular o desvio padrão ponderado em python
O desvio padrão ponderado é uma forma útil de medir a dispersão de valores em um conjunto de dados quando alguns valores no conjunto de dados têm pesos mais altos do que outros.
A fórmula para calcular um desvio padrão ponderado é:
Ouro:
- N: O número total de observações
- M: O número de pesos diferentes de zero
- w i : Um vetor de peso
- x i : Um vetor de valores de dados
- x : A média ponderada
A maneira mais fácil de calcular um desvio padrão ponderado em Python é usar a função DescrStatsW() do pacote statsmodels:
DescrStatsW(values, weights=weights, ddof= 1 ). std
O exemplo a seguir mostra como usar esta função na prática.
Exemplo: Desvio Padrão Ponderado em Python
Suponha que temos a seguinte matriz de valores de dados e os pesos correspondentes:
#define data values values = [14, 19, 22, 25, 29, 31, 31, 38, 40, 41] #define weights weights = [1, 1, 1.5, 2, 2, 1.5, 1, 2, 3, 2]
O código a seguir mostra como calcular o desvio padrão ponderado para esta matriz de valores de dados:
from statsmodels. stats . weightstats import DescrStatsW
#calculate weighted standard deviation
DescrStatsW(values, weights=weights, ddof= 1 ). std
8.570050878426773
O desvio padrão ponderado é 8,57 .
Observe que também podemos usar var para calcular rapidamente a variação ponderada:
from statsmodels. stats . weightstats import DescrStatsW
#calculate weighted variance
DescrStatsW(values, weights=weights, ddof= 1 ). var
73.44577205882352
A variância ponderada acabou sendo 73.446 .
Recursos adicionais
Os tutoriais a seguir explicam como calcular o desvio padrão ponderado em outro software estatístico:
Como calcular o desvio padrão ponderado no Excel
Como calcular o desvio padrão ponderado em R