가설 대비

이 기사에서는 통계에서 가설 검정이 무엇인지 설명합니다. 따라서 가설 검정을 수행하는 방법, 다양한 유형의 가설 검정 및 가설 검정을 수행할 때 범할 수 있는 실수에 대해 알아봅니다.

가설 검정이란 무엇입니까?

가설 검정은 통계적 가설을 기각하거나 거부하는 데 사용되는 절차입니다. 가설 검정에서는 모집단 매개변수의 값이 해당 모집단 표본에서 관찰된 값과 호환되는지 여부를 판단합니다.

즉, 가설검정에서는 통계적 표본을 분석하고, 그 결과를 바탕으로 이미 설정된 가설을 기각할지, 수용할지를 결정하는 것이다.

일반적으로 가설 검정을 통해 가설이 참인지 거짓인지 완전히 확실하게 추론할 수는 없지만, 얻은 결과에 따라 가설이 단순히 기각되는지 여부는 확실하게 추론할 수 있습니다. 따라서 가설을 테스트할 때 내려진 결정이 가장 가능성이 높다는 통계적 증거가 있더라도 여전히 오류가 발생할 수 있습니다.

통계에서는 가설 검정을 가설 검정 , 가설 검정 또는 유의성 검정 이라고도 합니다.

가설 검정 이론은 영국의 통계학자 Ronald Fisher에 의해 확립되었으며 Jerzy Neyman과 Egon Pearson에 의해 더욱 발전되었습니다.

귀무가설과 대립가설

가설 검정은 두 가지 유형의 통계적 가설로 구성됩니다.

  • 귀무 가설(H 0 ) : 모집단 모수에 관해 우리가 가지고 있는 초기 가설이 거짓임을 유지하는 가설입니다. 따라서 귀무 가설은 우리가 기각하려는 가설입니다.
  • 대립 가설(H 1 ) : 진실이 입증되어야 하는 연구 가설입니다. 즉, 대립가설은 연구자의 사전 가설이며, 그것이 참임을 증명하기 위해 대조가설을 수행하게 된다.

실제로 대립 가설은 데이터 샘플의 통계적 분석을 통해 확증하려는 가설이기 때문에 귀무 가설보다 먼저 공식화됩니다. 귀무 가설은 대립 가설을 모순함으로써 간단히 공식화됩니다.

가설 검정의 유형

가설 검정은 두 가지 유형으로 분류될 수 있습니다.

  • 양측 가설 검정(또는 양측 가설 검정) : 가설 검정의 대립 가설은 모집단 모수가 특정 값과 “다르다”는 것입니다.
  • 단측 가설 검정(또는 단측 가설 검정) : 가설 검정의 대립 가설은 모집단 모수가 특정 값보다 “보다 큼”(오른쪽 꼬리) 또는 “보다 작음”(왼쪽 꼬리)을 나타냅니다.

양측 가설 검정

\begin{cases}H_0: \mu=\mu_0\\[2ex]H_1:\mu\neq\mu_0\end{cases}

단측 가설 검정(오른쪽 꼬리)

\begin{cases}H_0: \mu\leq \mu_0\\[2ex]H_1:\mu>\mu_0\end{cases}” title=”Rendered by QuickLaTeX.com” height=”65″ width=”102″ style=”vertical-align: 0px;”></p>
</p>
</div>
<div class=

단측 가설 검정(왼쪽 꼬리)

\begin{cases}H_0: \mu\geq\mu_0\\[2ex]H_1:\mu<\mu_0\end{cases}

가설검정의 기각영역과 수용영역

아래에서 자세히 살펴보겠지만, 가설 검정은 각 유형의 가설 검정의 특성값을 계산하는 것으로 구성되며, 이 값을 가설 검정 통계라고 합니다. 따라서 대비 통계가 계산되면 결론에 도달하려면 다음 두 지역 중 어느 지역에 있는지 관찰해야 합니다.

  • 기각 영역(또는 임계 영역) : 귀무 가설을 기각(및 대립 가설을 수락)하는 가설 검정 기준 분포 그래프의 영역입니다.
  • 수용 영역(Acceptance Region) : 귀무 가설의 수용(및 대립 가설의 기각)을 암시하는 가설 검정 기준 분포 그래프의 영역입니다.

즉, 검정 통계량이 거부 영역에 속하면 귀무가설이 기각되고 대립가설이 채택됩니다. 반대로 검정통계량이 수용영역에 속하면 귀무가설은 채택되고 대립가설은 기각된다.

가설 대비

거부 영역과 합격 영역의 경계를 설정하는 값을 임계값 이라고 하며, 마찬가지로 거부 영역을 정의하는 값의 간격을 신뢰 구간 이라고 합니다. 그리고 두 값 모두 선택한 유의 수준 에 따라 달라집니다.

참조: 알파 유의수준

한편, 귀무가설의 기각 또는 수락 여부는 가설 검정에서 얻은 p-값 (또는 p-값)을 선택한 유의 수준과 비교하여 내릴 수도 있습니다.

가설 검정을 수행하는 방법

가설 검정을 수행하려면 다음 단계를 따라야 합니다.

  1. 가설검정의 귀무가설과 대립가설을 기술합니다.
  2. 원하는 알파(α) 유의 수준을 설정합니다.
  3. 가설 대비 통계를 계산합니다.
  4. 가설 검정의 기각 영역과 수용 영역을 알기 위해 가설 검정의 임계값을 결정합니다.
  5. 가설 대비 통계가 기각 영역에 있는지 아니면 수용 영역에 있는지 관찰합니다.
  6. 통계가 기각 영역에 속하면 귀무 가설이 기각되고 대립 가설이 채택됩니다. 그러나 통계가 수용 영역에 속하면 귀무 가설이 채택됩니다(대립 가설은 기각됩니다).

가설 검정 오류

가설 검정에서 하나의 가설을 기각하고 다른 검정 가설을 채택할 때 다음 두 가지 오류 중 하나가 발생할 수 있습니다.

  • 제1종 오류 : 귀무가설이 실제로 참인데도 이를 기각할 때 발생하는 오류입니다.
  • 제2종 오류 : 귀무가설이 실제로 거짓임에도 불구하고 이를 받아들임으로써 발생하는 오류이다.
제1종 오류와 제2종 오류

한편, 각 유형의 오류를 범할 확률은 다음과 같이 불립니다.

  • 알파 확률(α) : 제1종 오류를 범할 확률입니다.
  • 베타 확률(β) : 제2종 오류를 범할 확률입니다.

마찬가지로, 가설 검정의 검정력은 귀무가설(H 0 )이 거짓일 때 이를 기각할 확률, 즉 참일 때 대립가설(H 1 )을 선택할 확률로 정의됩니다. 따라서 가설 검정의 검정력은 1-β와 같습니다.

가설 검정 통계

가설 검정의 통계량은 귀무 가설의 기각 여부를 결정하는 데 사용되는 가설 검정 기준 분포의 값입니다. 검정 통계량이 기각 영역에 속하면 귀무가설이 기각되고(대립가설이 채택됨), 검정 통계량이 수용 영역에 속하면 귀무가설이 채택됩니다(대립가설은 다음과 같습니다). 거부됨).대체 가설).

가설 검정 통계량의 계산은 검정 유형에 따라 다릅니다. 따라서 각 가설검정 유형에 따른 통계량 계산식은 다음과 같다.

평균에 대한 가설 검정

알려진 분산이 있는 평균에 대한 가설 검정 통계량의 공식은 다음과 같습니다.

\displaystyle Z=\frac{\overline{x}-\mu}{\displaystyle \frac{\sigma}{\sqrt{n}}}

금:

  • Z

    평균에 대한 가설 대비 통계입니다.

  • \overline{x}

    샘플 수단입니다.

  • \mu

    제안된 평균값입니다.

  • \sigma

    모집단 표준편차입니다.

  • n

    표본 크기입니다.

평균에 대한 가설 검정 통계량이 계산되면 결과는 귀무 가설을 기각할지 여부를 해석해야 합니다.

  • 평균에 대한 가설 검정이 양측인 경우 통계의 절대값이 임계값 Z α/2 보다 크면 귀무가설이 기각됩니다.
  • 평균에 대한 가설 검정이 오른쪽 꼬리와 일치하는 경우 통계량이 임계값 보다 크면 귀무가설이 기각됩니다.
  • 평균에 대한 가설 검정이 왼쪽 꼬리와 일치하는 경우 통계량이 임계값 -Z α 보다 작으면 귀무가설이 기각됩니다.

\begin{array}{l}H_1: \mu\neq \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } |Z|>Z_{\alpha/2} \text{ se rechaza } H_0\\[3ex]H_1: \mu> \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } Z>Z_{\alpha} \text{ se rechaza } H_0\\[3ex]H_1: \mu< \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } Z<-Z_{\alpha} \text{ se rechaza } H_0\end{array}

이 경우 표준화된 정규분포표에서 임계값을 구한다.

반면, 분산을 알 수 없는 평균에 대한 가설 검정 통계량의 공식은 다음과 같습니다.

\displaystyle t=\frac{\overline{x}-\mu}{\displaystyle \frac{s}{\sqrt{n}}}

금:

  • t

    는 스튜던트 t 분포로 정의되는 평균에 대한 가설 검정 통계량입니다.

  • \overline{x}

    샘플 수단입니다.

  • \mu

    제안된 평균값입니다.

  • s

    표본 표준편차입니다.

  • n

    표본 크기입니다.

이전과 마찬가지로 검정 통계량의 계산된 결과는 귀무 가설을 기각할지 여부를 결정하는 임계값으로 해석되어야 합니다.

  • 평균에 대한 가설 검정이 양측인 경우 통계의 절대값이 임계값 t α/2|n-1 보다 크면 귀무가설이 기각됩니다.
  • 평균에 대한 가설 검정이 오른쪽 꼬리와 일치하는 경우 통계량이 임계값 t α|n-1 보다 크면 귀무가설이 기각됩니다.
  • 평균에 대한 가설 검정이 왼쪽 꼬리와 일치하는 경우 통계가 임계값 -t α|n-1 보다 작으면 귀무가설이 기각됩니다.

\begin{array}{l}H_1: \mu\neq \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } |t|>t_{\alpha/2|n-1} \text{ se rechaza } H_0\\[3ex]H_1: \mu> \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } t>t_{\alpha|n-1} \text{ se rechaza } H_0\\[3ex]H_1: \mu< \mu_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } t<-t_{\alpha|n-1} \text{ se rechaza } H_0\end{array}

분산을 알 수 없는 경우 스튜던트 분포표에서 중요한 검정 값을 얻습니다.

비율에 대한 가설 검정

비율에 대한 가설 검정 통계의 공식은 다음과 같습니다.

\displaystyle Z=\frac{\widehat{p}-p}{\displaystyle\sqrt{\frac{p(1-p)}{n}}}

금:

  • Z

    비율에 대한 가설 검정 통계량입니다.

  • \widehat{p}

    표본 비율입니다.

  • p

    제안된 비율 값입니다.

  • n

    표본 크기입니다.

  • \displaystyle\sqrt{\frac{p(1-p)}{n}}

    비율의 표준편차입니다.

비율에 대한 가설 검정 통계량을 계산하는 것만으로는 충분하지 않지만 결과는 다음과 같이 해석되어야 합니다.

  • 비율에 대한 가설 검정이 양측인 경우 통계의 절대값이 임계값 Z α/2 보다 크면 귀무가설이 기각됩니다.
  • 비율에 대한 가설 검정이 오른쪽 꼬리와 일치하는 경우 통계량이 임계값 보다 크면 귀무가설이 기각됩니다.
  • 비율에 대한 가설 검정이 왼쪽 꼬리와 일치하는 경우 통계량이 임계값 -Z α 보다 작으면 귀무가설이 기각됩니다.

\begin{array}{l}H_1: p\neq p_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } |Z|>Z_{\alpha/2} \text{ se rechaza } H_0\\[3ex]H_1: p> p_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } Z>Z_{\alpha} \text{ se rechaza } H_0\\[3ex]H_1: p< p_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } Z<-Z_{\alpha} \text{ se rechaza } H_0\end{array}

표준정규분포표에서 임계값을 쉽게 얻을 수 있다는 점을 기억하세요.

분산에 대한 가설 검정

분산에 대한 가설 검정 통계량을 계산하는 공식은 다음과 같습니다.

\chi^2=\cfrac{(n-1)s^2}{\sigma^2}

금:

  • \chi^2

    카이제곱 분포를 갖는 분산에 대한 가설 검정 통계입니다.

  • n

    표본 크기입니다.

  • s^2

    표본 분산입니다.

  • \sigma^2

    제안된 모집단의 분산입니다.

통계 결과를 해석하려면 얻은 값을 테스트의 임계값과 비교해야 합니다.

  • 분산에 대한 가설 검정이 양측 검정인 경우 통계량이 임계값보다 크면 귀무가설이 기각됩니다.

    \chi_{1-\alpha/2|n-1}^2

    또는 임계값이 다음보다 작은 경우

    \chi_{\alpha/2|n-1}

    .

  • 분산에 대한 가설 검정이 오른쪽 꼬리와 일치하는 경우 통계량이 임계값보다 크면 귀무가설이 기각됩니다.

    \chi_{1-\alpha|n-1}^2

    .

  • 분산에 대한 가설 검정이 왼쪽 꼬리와 일치하는 경우 통계량이 임계값보다 작으면 귀무가설이 기각됩니다.

    \chi_{\alpha|n-1}

    .

\begin{array}{l}H_1: \sigma^2\neq \sigma_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } \chi^2>\chi^2_{1-\alpha/2|n-1}\text{ se rechaza } H_0\\[3ex]H_1: \sigma^2\neq \sigma_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si }\chi^2<\chi^2_{\alpha/2|n-1}\text{ se rechaza } H_0 \\[3ex]H_1: \sigma^2> \sigma_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } \chi^2>\chi^2_{1-\alpha|n-1}\text{ se rechaza } H_0\\[3ex]H_1: \sigma^2< \sigma_0 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Si } \chi^2<\chi^2_{\alpha|n-1}\text{ se rechaza } H_0\end{array}

분산에 대한 임계 가설 검정 값은 카이제곱 분포표에서 얻습니다. 카이제곱 분포의 자유도는 표본 크기에서 1을 뺀 값입니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다