분산 측정

이 기사에서는 분산 측정이 무엇인지, 이러한 통계 측정항목이 어떤 용도로 사용되는지 알아봅니다. 또한 각 분산 측정값이 어떻게 계산되는지 확인할 수 있습니다.

분산 조치란 무엇입니까?

분산 측정값은 데이터 세트의 분산을 나타내는 통계적 측정값입니다. 즉, 분산 측정은 표본 내 데이터의 분산 정도를 평가하는 데 사용됩니다.

분산 측도는 변동성 측도 또는 확산 측도 라고도 합니다.

분산 조치는 무엇입니까?

분산 측정은 다음과 같습니다.

  • 표준편차(또는 표준편차)
  • 변화
  • 변동 계수
  • 정돈하다
  • 사분위수 범위
  • 중간 차이

다음은 각 분산 측정값을 결정하는 방법을 설명합니다.

표준 편차

표준 편차 는 일반 편차 라고도 하며 데이터 계열의 편차 제곱합을 총 관측치 수로 나눈 값의 제곱근과 같습니다.

따라서 이 분산 측정의 공식은 다음과 같습니다.

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

변화

분산은 총 관측치 수에 대한 잔차 제곱의 합과 같습니다. 따라서 이 분산 측정법의 공식은 다음과 같습니다.

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

금:

  • X

    분산을 계산하려는 확률 변수입니다.

  • x_i

    데이터 값입니다

    i

    .

  • n

    총 관측치 수입니다.

  • \overline{X}

    확률변수의 평균이다

    X

    .

참조: 편차 계산 예

변동 계수

통계에서 변동 계수는 평균을 기준으로 데이터 세트의 분산을 결정하는 데 사용되는 분산 척도입니다. 변동계수는 데이터의 표준편차를 평균으로 나눈 후 100을 곱하여 백분율로 표시하는 방식으로 계산됩니다.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

정돈하다

범위 는 샘플에 있는 데이터의 최대값과 최소값 간의 차이를 나타내는 분산 측정값입니다. 따라서 모집단이나 통계 표본의 범위를 계산하려면 최소값에서 최대값을 빼야 합니다.

R=\text{M\'ax}-\text{M\'in}

사분위수 범위

사분위간 범위 라고도 불리는 사분위간 범위는 세 번째 사분위수와 첫 번째 사분위수 간의 차이를 나타내는 통계적 분산의 척도입니다.

따라서 통계 데이터 세트의 사분위수 범위를 계산하려면 먼저 세 번째와 첫 번째 사분위수를 구한 다음 이를 빼야 합니다.

IQR=Q_3-Q_1

사분위수 범위에 대한 기호는 영어 사분위수 범위 에서 따온 IQR입니다.

이 분산 측정의 가장 유리한 특성 중 하나는 강력한 통계, 즉 이상값에 대한 높은 견고성을 갖는다는 것입니다. 사분위수 범위 계산에서는 극단값이 고려되지 않기 때문에 새로운 이상치가 나타나더라도 그 값은 거의 변하지 않습니다.

중간 차이

평균 절대 편차 라고도 하는 평균 편차 는 절대 편차의 평균입니다. 따라서 평균 편차는 산술 평균과 각 데이터 항목의 편차의 합을 총 데이터 항목 수로 나눈 값과 같습니다.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

분산 측정은 무엇을 위해 사용됩니까?

분산 측정은 통계 샘플의 분산을 평가하는 데 사용됩니다. 즉, 분산 측정을 통해 데이터 세트의 분산을 정량화할 수 있으며, 얻은 값에서 데이터 샘플의 분산을 분석할 수 있습니다.

분산 측정은 데이터 샘플을 설명하는 데 도움이 되기 때문에 널리 사용됩니다. 분산 측정은 데이터 시리즈의 모양을 이해하는 데 도움이 됩니다.

자주 계산되는 다른 통계적 측정값으로는 중심 경향 측정값과 위치 측정값이 있습니다. 일반적으로 단일 통계 측정이 결정되지 않고 연구 중인 데이터의 모양을 더 잘 이해하기 위해 여러 측정이 수행됩니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다