좋은 표준편차로 간주되는 것은 무엇입니까?
표준편차는 표본의 값 분포를 측정하는 데 사용됩니다.
다음 공식을 사용하여 주어진 표본의 표준 편차를 계산할 수 있습니다.
√ Σ(x i – x bar ) 2 / (n-1)
금:
- Σ: 합계를 의미하는 기호
- x i : 샘플의 i번째 값
- x bar : 샘플 평균
- n: 표본 크기
표준 편차 값이 높을수록 값이 샘플 에 더 많이 분산되어 있습니다. 반대로, 표준편차 값이 낮을수록 값이 더 밀접하게 클러스터링됩니다.
학생들이 자주 묻는 질문은 표준편차에 대한 좋은 값으로 간주되는 것은 무엇입니까?
대답: 표준 편차는 단순히 표본의 값 분포를 알려주기 때문에 “좋다”거나 “나쁘다”일 수 없습니다.
표준 편차가 “높음”인지 “낮음”인지를 결정하는 보편적인 숫자도 없습니다. 예를 들어 다음 시나리오를 고려해보세요.
시나리오 1: 부동산 중개인이 자신이 사는 마을에 있는 100채의 주택에 대한 가격 데이터를 수집하고 가격의 표준 편차가 $12,000임을 확인합니다.
시나리오 2 : 한 경제학자는 미국 50개 주에서 징수된 총 소득세를 측정하고 징수된 총 소득세의 표준 편차가 $480,000라는 것을 발견했습니다.
시나리오 2의 표준편차는 시나리오 1의 표준편차보다 훨씬 높지만, 주정부가 징수하는 총 세금이 부동산 가격보다 훨씬 높기 때문에 시나리오 2에서 측정된 단위는 훨씬 더 높습니다.
이는 표준편차가 “좋음”인지 “나쁨”인지, 심지어 “높음”인지 “낮음”인지 판단하는 데 사용할 수 있는 단일 숫자가 없다는 것을 의미합니다. 왜냐하면 상황에 따라 달라지기 때문입니다.
변동 계수 사용
표준 편차가 높은지 확인하는 한 가지 방법은 이를 데이터 세트의 평균과 비교하는 것입니다.
종종 CV 로 축약되는 변동 계수는 평균을 기준으로 데이터 세트의 값 확산을 측정하는 방법입니다. 다음과 같이 계산됩니다.
이력서 = s/ x
금:
- s: 데이터세트의 표준편차
- x : 데이터 세트의 평균
간단히 말해서 CV는 평균에 대한 표준편차의 비율입니다.
CV가 높을수록 평균 과의 표준편차가 커집니다. 일반적으로 CV 값이 1보다 크면 높은 것으로 간주되는 경우가 많습니다.
예를 들어, 부동산 중개업자가 자신이 사는 마을에 있는 100채의 주택에 대한 가격 데이터를 수집하여 평균 가격이 $150,000이고 가격의 표준 편차가 $12,000라는 사실을 발견했다고 가정합니다. CV는 다음과 같이 계산됩니다.
- 이력서: $12,000 / $150,000 = 0.08
이 CV 값은 1보다 훨씬 작으므로 데이터의 표준편차가 매우 낮다는 것을 의미합니다.
반대로, 경제학자가 미국 50개 주에서 징수한 총 소득세를 측정하여 표본 평균이 $400,000이고 표준 편차가 $480,000라는 것을 발견했다고 가정합니다. CV는 다음과 같이 계산됩니다.
- 이력서: $480,000 / $400,000 = 1.2
이 CV 값이 1보다 크므로 이는 데이터 값의 표준편차가 상당히 높다는 것을 의미합니다.
데이터 세트 간의 표준 편차 비교
우리는 다양한 데이터 세트에 걸쳐 값의 분포를 측정하기 위해 종종 표준편차를 사용합니다.
예를 들어, 교수가 한 학기 동안 학생들에게 세 번의 시험을 낸다고 가정해 보겠습니다. 그런 다음 각 시험 점수의 표준 편차를 계산합니다.
- 시험 결과 1의 표준 편차 예: 4.6
- 시험 결과 2의 표준 편차 예: 12.4
- 시험 결과의 표준편차 예시 3: 2.3
이는 시험 결과가 시험 2에서 가장 분산되어 있는 반면, 시험 3에서는 결과가 가장 밀접하게 클러스터되어 있음을 교수에게 알려줍니다.