평균의 차이에 대한 가설 검정

이 글에서는 통계학에서 평균가설검정의 차이와 그 용도에 대해 설명합니다. 마찬가지로, 평균 차이에 대한 가설 검정을 수행하는 방법과 단계별 해결 연습을 배우게 됩니다.

평균 차이에 대한 가설 검정이란 무엇입니까?

평균 차이에 대한 가설 검정은 두 모집단의 평균이 다르다는 가설을 기각하거나 수락하는 데 사용되는 통계 검정입니다. 즉, 평균 차이 가설 검정은 두 모집단의 평균이 같은지 다른지를 확인하는 데 사용됩니다.

가설 테스트의 결정은 이전에 확립된 신뢰도 수준을 기반으로 하므로 가설 테스트 결과가 항상 정확하다고 보장할 수는 없으며 오히려 참일 가능성이 가장 높은 결과라는 점을 명심하세요.

두 평균의 차이에 대한 가설 검정에는 검정 통계량을 계산하고 이를 임계값과 비교하여 귀무 가설을 기각하는지 여부가 포함됩니다. 아래에서는 평균의 차이에 대한 가설 검정을 수행하는 방법을 살펴보겠습니다.

마지막으로, 통계에서 가설 검정은 가설 대비, 가설 검정 또는 유의성 검정이라고도 합니다.

평균 차이에 대한 가설 검정 공식

평균의 차이에 대한 가설을 검정하는 데 사용해야 하는 공식은 모집단 분산이 알려져 있는지 여부, 그렇지 않은 경우 동일하거나 다른 것으로 가정할 수 있는지 여부에 따라 달라집니다. 그래서 이번 절에서는 경우에 따라 어떤 공식을 사용해야 하는지 알아보겠습니다.

알려진 변형

분산이 알려진 경우 평균 차이에 대한 가설 검정 통계량을 계산하는 공식은 다음과 같습니다.

\displaystyle Z=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}

금:

  • Z

    표준 정규 분포를 따르는 분산이 알려진 두 평균의 차이에 대한 가설 검정 통계입니다.

  • \mu_1

    모집단 1의 평균입니다.

  • \mu_2

    모집단 2의 평균입니다.

  • \overline{x_1}

    표본 1의 평균입니다.

  • \overline{x_2}

    표본 2의 평균입니다.

  • \sigma_1

    모집단 1의 표준편차입니다.

  • \sigma_2

    모집단 2의 표준편차입니다.

  • n_1

    표본 크기는 1입니다.

  • n_2

    표본 크기는 2입니다.

이는 흔하지 않은 경우이므로 이 공식은 일부 특정 경우에만 사용된다는 점을 명심하세요.

알 수 없는 동일한 편차

모집단 분산을 알 수 없지만 동일하다고 가정할 때 평균 차이에 대한 가설 검정 통계량을 계산하는 공식은 다음과 같습니다 .

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

금:

  • t

    는 자유도가 n 1 + n 2 -2인 스튜던트 t 분포를 따르는 알 수 없는 분산을 갖는 평균의 차이에 대한 가설 검정 통계입니다.

  • \mu_1

    모집단 1의 평균입니다.

  • \mu_2

    모집단 2의 평균입니다.

  • \overline{x_1}

    표본 1의 평균입니다.

  • \overline{x_2}

    표본 2의 평균입니다.

  • s_p

    결합된 표준편차입니다.

  • n_1

    표본 크기는 1입니다.

  • n_2

    표본 크기는 2입니다.

두 표본의 결합된 표준 편차는 다음 공식으로 계산됩니다.

\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

알려지지 않은 다양한 변형

모집단 분산을 알 수 없고 또한 서로 다르다고 가정하는 경우 평균 차이에 대한 가설 검정 통계량을 계산하는 공식은 다음과 같습니다.

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}

금:

  • t

    스튜던트 t 분포를 따르는, 분산을 알 수 없는 평균의 차이에 대한 가설 검정 통계입니다.

  • \mu_1

    모집단 1의 평균입니다.

  • \mu_2

    모집단 2의 평균입니다.

  • \overline{x_1}

    표본 1의 평균입니다.

  • \overline{x_2}

    표본 2의 평균입니다.

  • \sigma_1

    모집단 1의 표준편차입니다.

  • \sigma_2

    모집단 2의 표준편차입니다.

  • n_1

    표본 크기는 1입니다.

  • n_2

    표본 크기는 2입니다.

그러나 이 경우 스튜던트 t 분포의 자유도는 다음 공식을 사용하여 계산됩니다.

\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}

평균 차이에 대한 가설 검정의 구체적인 예

평균 차이에 대한 가설 검정의 개념을 익히기 위해 이러한 유형의 가설 검정에 대한 구체적인 예를 살펴보겠습니다.

  • 두 경쟁 회사의 급여에 대한 통계적 연구를 수행하려고 합니다. 보다 구체적으로 두 회사의 평균 급여가 다른지 확인하려고 합니다. 이를 위해 한 회사의 직원 47명과 다른 회사의 직원 55명의 표본을 추출합니다. 첫 번째 표본에서는 평균 급여 $40,000와 표준 편차 $12,000를 얻었고, 두 번째 표본에서는 평균 급여 $46,000와 표준 편차 $18,000를 얻었습니다. 평균 급여가 다른지 여부를 확인하려면 5% 유의 수준으로 가설 검정을 수행하십시오.

이 경우 두 평균의 차이에 대한 가설검정의 귀무가설과 대립가설은 다음과 같다.

\begin{cases}H_0: \mu_1-\mu_2=0\\[2ex] H_1:\mu_1-\mu_2\neq 0 \end{cases}

이 경우 인구 격차는 알 수 없으나, 경쟁 기업이고, 그들이 활동하는 시장의 근로 조건이 매우 유사하기 때문에 동등하다고 가정할 수 있습니다. 따라서 우리가 사용해야 하는 평균의 차이에 대한 가설 검정 통계의 공식은 다음과 같습니다.

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

따라서 두 표본의 합동 표준 편차를 계산합니다.

\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(47-1)\cdot 12000^2+(55-1)\cdot 18000^2}{47+55-2}}\\[2ex]s_p&=15530,61\end{aligned}

이제 평균 차이에 대한 가설 검정 공식을 적용합니다.

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}=\cfrac{(40000-46000)-0}{\displaystyle 15530,61\sqrt{\frac{1}{47}+\frac{1}{55}}}=-1,94

반면, 스튜던트 t 테이블 에서 평균 차이에 대한 가설 검정의 임계값을 찾습니다.

\alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025| 100}=1,984\end{array}

그러면 검정 통계량의 절대값이 임계 검정값보다 작으므로 귀무가설이 채택되고 대립가설이 기각됩니다.

|-1,94|=1,94<1,984 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_1

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다