형상 측정

이 문서에서는 형상 측정이 무엇인지 설명합니다. 따라서 어떤 모양 메트릭이 사용되는지, 모양 메트릭이 해석되는 방법, 이러한 유형의 통계 메트릭이 계산되는 방법을 배우게 됩니다.

형상 측정이란 무엇입니까?

통계에서 형태 측정은 형태에 따라 확률 분포를 설명할 수 있는 지표입니다. 즉, 모양 측정값은 그래프를 작성할 필요 없이 분포의 모양을 결정하는 데 사용됩니다.

형상 측정에는 왜도와 첨도라는 두 가지 유형이 있습니다. 왜도는 분포가 얼마나 대칭적인지를 나타내고, 첨도는 분포가 평균 주위에 얼마나 집중되어 있는지를 나타냅니다.

모양 측정은 무엇입니까?

형태 측정값의 정의를 고려하여 이 섹션에서는 이러한 유형의 통계 매개변수가 무엇인지 보여줍니다.

통계에서는 두 가지 형태 측정값을 구별합니다.

  • 왜도 : 분포가 대칭인지 비대칭인지를 나타냅니다.
  • 첨도 – 분포가 가파른지 평평한지 여부를 나타냅니다.

어울리지 않음

비대칭에는 세 가지 유형이 있습니다.

  • 양의 비대칭성 : 분포의 평균은 왼쪽보다 오른쪽에 더 많은 값이 있습니다.
  • 대칭성(Symmetry) : 분포는 평균의 오른쪽과 평균의 왼쪽에 동일한 수의 값이 있습니다.
  • 음의 왜도 : 분포는 평균의 오른쪽보다 왼쪽에 더 많은 값이 있습니다.
비대칭의 종류

비대칭 계수

왜도 계수 또는 비대칭 지수는 분포의 비대칭성을 결정하는 데 도움이 되는 통계 계수입니다. 따라서 비대칭 계수를 계산하면 분포를 그래픽으로 표현하지 않고도 분포의 비대칭 유형을 알 수 있습니다.

비대칭 계수를 계산하는 공식에는 여러 가지가 있으며 아래에서 모두 볼 수 있지만 사용된 공식에 관계없이 비대칭 계수의 해석은 항상 다음과 같이 수행됩니다.

  • 왜도 계수가 양수이면 분포는 양수로 치우쳐 있습니다 .
  • 왜도 계수가 0이면 분포는 대칭 입니다.
  • 왜곡도 계수가 음수이면 분포는 음수로 왜곡 됩니다.
피셔의 비대칭 계수

Fisher의 왜도 계수는 평균에 대한 세 번째 모멘트를 표본 표준 편차로 나눈 값과 같습니다. 따라서 Fisher의 비대칭 계수 공식은 다음과 같습니다.

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

마찬가지로, 다음 두 공식 중 하나를 사용하여 Fisher 계수를 계산할 수 있습니다.

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

E

수학적 기대값입니다.

\mu

산술 평균,

\sigma

표준편차

N

총 데이터 수입니다.

반면에 데이터가 그룹화되면 다음 공식을 사용할 수 있습니다.

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

이 경우 어디에

x_i

그것은 클래스의 표시이며

f_i

코스의 절대 빈도.

피어슨의 비대칭 계수

피어슨의 왜도 계수는 표본 평균과 모드 간의 차이를 표준 편차(또는 표준 편차)로 나눈 값과 같습니다. 따라서 Pearson 비대칭 계수의 공식은 다음과 같습니다.

A_p=\cfrac{\mu-Mo}{\sigma}

A_p

피어슨 계수이고,

\mu

산술 평균,

Mo

패션과

\sigma

표준편차.

Pearson 왜도 계수는 단봉 분포인 경우, 즉 데이터에 모드가 하나만 있는 경우에만 계산할 수 있습니다.

Bowley의 비대칭 계수

Bowley의 왜도 계수는 세 번째 사분위수와 첫 번째 사분위수의 합에서 중앙값의 두 배를 뺀 값을 세 번째 사분위수와 첫 번째 사분위수 간의 차이로 나눈 값과 같습니다. 따라서 이 비대칭 계수의 공식은 다음과 같습니다.

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

Q_1

그리고

Q_3

는 각각 1사분위수와 3사분위수이고

Me

분포의 중앙값입니다.

평탄화

왜도라고도 하는 첨도 분포가 평균 주위에 얼마나 집중되어 있는지를 나타냅니다. 즉, 첨도는 분포가 가파른지 평평한지 여부를 나타냅니다. 특히, 분포의 첨도가 클수록 분포의 기울기가 더 가파르거나 뾰족해집니다.

유망한

아첨에는 세 가지 유형이 있습니다.

  • Leptokurtic : 분포가 매우 뾰족합니다. 즉, 데이터가 평균 주위에 강하게 집중되어 있음을 의미합니다. 보다 정확하게는 렙토쿠르틱 분포는 정규 분포보다 더 날카로운 분포로 정의됩니다.
  • Mesokurtic : 분포의 첨도는 정규 분포의 첨도와 동일합니다. 따라서 뾰족하지도 납작하지도 않은 것으로 간주됩니다.
  • Platicurtic : 분포가 매우 평탄합니다. 즉, 평균 주변의 집중도가 낮습니다. 공식적으로, 플래티커틱 분포는 정규 분포보다 평평한 분포로 정의됩니다.

다양한 유형의 첨도는 정규 분포의 첨도를 기준으로 하여 정의됩니다.

아첨의 종류

평탄화 계수

첨도 계수의 공식은 다음과 같습니다.

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

빈도표로 그룹화된 데이터 의 첨도 계수 공식은 다음과 같습니다.

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

마지막으로 간격으로 그룹화된 데이터 의 첨도 계수 공식은 다음과 같습니다.

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

금:

  • g_2

    첨도 계수입니다.

  • N

    총 데이터 개수입니다.

  • x_i

    시리즈의 i번째 데이터입니다.

  • \mu

    분포의 산술 평균입니다.

  • \sigma

    분포의 표준편차(또는 일반편차)입니다.

  • f_i

    it 데이터 세트의 절대 빈도입니다.

  • c_i

    는 i번째 그룹의 클래스 마크입니다.

모든 첨도 계수 공식에서 3은 정규 분포의 첨도 값이므로 뺍니다. 따라서 첨도 계수의 계산은 정규 분포의 첨도를 기준으로 수행됩니다. 통계에서 가끔 첨도가 과도하게 계산된다는 말이 나오는 이유도 바로 이 때문이다.

첨도 계수가 계산되면 다음과 같이 해석하여 첨도의 유형을 식별해야 합니다.

  • 첨도 계수가 양수이면 분포가 leptokurtic 함을 의미합니다.
  • 첨도 계수가 0이면 분포가 메소쿠르틱 하다는 의미입니다.
  • 첨도 계수가 음수이면 분포가 평면형 임을 의미합니다.

기타 유형의 통계 측정

다음 통계 측정값 중 하나에 관심이 있을 수도 있습니다. 하나를 클릭하여 측정값이 무엇인지, 계산 방법을 확인하세요.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다