Python에서 가중 표준 편차를 계산하는 방법
가중 표준편차는 데이터세트의 일부 값이 다른 값보다 가중치가 높은 경우 데이터세트 내 값의 분산을 측정하는 유용한 방법입니다.
가중 표준 편차를 계산하는 공식은 다음과 같습니다.

금:
- N: 총 관측치 수
- M: 0이 아닌 가중치의 개수
- w i : 가중치 벡터
- x i : 데이터 값의 벡터
- x : 가중 평균
Python에서 가중 표준 편차를 계산하는 가장 쉬운 방법은 statsmodels 패키지의 DescrStatsW() 함수를 사용하는 것입니다.
DescrStatsW(values, weights=weights, ddof= 1 ). std
다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.
예: Python의 가중 표준 편차
다음과 같은 데이터 값 배열과 해당 가중치가 있다고 가정합니다.
#define data values values = [14, 19, 22, 25, 29, 31, 31, 38, 40, 41] #define weights weights = [1, 1, 1.5, 2, 2, 1.5, 1, 2, 3, 2]
다음 코드는 이 데이터 값 배열에 대한 가중 표준 편차를 계산하는 방법을 보여줍니다.
from statsmodels. stats . weightstats import DescrStatsW
#calculate weighted standard deviation
DescrStatsW(values, weights=weights, ddof= 1 ). std
8.570050878426773
가중 표준편차는 8.57 로 나타났습니다.
var를 사용하여 가중치 분산을 빠르게 계산할 수도 있습니다.
from statsmodels. stats . weightstats import DescrStatsW
#calculate weighted variance
DescrStatsW(values, weights=weights, ddof= 1 ). var
73.44577205882352
가중 분산은 73,446 으로 나타났습니다.
추가 리소스
다음 튜토리얼에서는 다른 통계 소프트웨어에서 가중 표준 편차를 계산하는 방법을 설명합니다.