평균 차이에 대한 신뢰 구간

이 기사에서는 통계의 평균 차이에 대한 신뢰 구간이 무엇인지, 그리고 그 용도에 대해 설명합니다. 따라서 두 평균의 차이에 대한 신뢰 구간을 계산하는 방법과 단계별로 해결하는 연습을 살펴보겠습니다.

평균 차이에 대한 신뢰 구간은 무엇입니까?

평균 차이에 대한 신뢰 구간은 두 모집단의 평균 차이 값이 일정 수준의 신뢰도를 갖는 최대값과 최소값을 제공하는 구간입니다.

예를 들어, 95% 신뢰 수준에서 두 모집단의 평균 차이에 대한 신뢰 구간이 (3.5)인 경우 이는 두 모집단의 평균 차이가 95의 확률로 3과 5 사이에 있음을 의미합니다. %.

따라서 통계에서는 평균 차이에 대한 신뢰 구간을 사용하여 두 모집단 평균 간의 차이가 있는 두 값을 추정합니다. 따라서 두 표본의 데이터를 사용하여 모집단 평균 간의 차이를 근사화하는 것이 가능합니다.

평균 차이에 대한 신뢰 구간 공식

평균 차이에 대한 신뢰 구간 공식은 모집단 분산을 알고 있는지 여부와 그렇지 않은 경우 모집단 분산이 동일하다고 가정할 수 있는지 여부에 따라 달라집니다. . 그런 다음 각 경우에 평균 차이에 대한 신뢰 구간이 어떻게 계산되는지 살펴보겠습니다.

알려진 편차

신뢰 수준 1-α로 두 모집단의 분산이 알려진 경우 평균 차이에 대한 신뢰 구간을 계산하는 공식은 다음과 같습니다.

\displaystyle (\overline{x_1}-\overline{x_2})\pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}

금:

  • \overline{x_i}

    표본 i의 평균입니다.

  • \sigma_i

    는 모집단 i의 표준편차입니다.

  • Z_{\alpha/2}

    는 확률이 α/2인 표준 정규 분포의 값입니다.

  • n_i

    표본 크기는 i입니다.

모집단 분산의 값이 일반적으로 알려져 있지 않기 때문에 이 경우는 가장 흔하지 않습니다.

알 수 없는 등분산

두 모집단의 분산을 알 수 없지만 동일하다고 추정할 수 있는 경우 신뢰 수준 1-α에서 평균 차이에 대한 신뢰 구간을 계산하는 공식은 다음과 같습니다.

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

금:

  • \overline{x_i}

    표본 i의 평균입니다.

  • s_p

    합동 표준편차입니다.

  • t_{\alpha/2}

    는 확률이 α/2인 n 1 + n 2 -2 자유도의 스튜던트 t 분포 값입니다.

  • n_i

    표본 크기는 i입니다.

이 경우 모집단 분산이 동일하다고 가정하므로 결합된 표준 편차를 사용하여 신뢰 구간을 계산하며 이는 다음 공식으로 계산됩니다.

\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

s_i

표본 i의 표준편차입니다.

알려지지 않은 다양한 변형

두 모집단의 분산을 알 수 없고 동일하다고 가정할 수 없는 경우 신뢰 수준이 1-α인 평균 차이에 대한 신뢰 구간을 계산하는 공식은 다음과 같습니다.

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}

금:

  • \overline{x_i}

    표본 i의 평균입니다.

  • s_i

    표본 i의 표준편차입니다.

  • t_{\alpha/2}

    는 확률이 α/2인 스튜던트 t 분포의 값입니다.

  • n_i

    표본 크기는 i입니다.

이 경우 스튜던트 t 분포의 자유도는 다음 공식을 사용하여 계산됩니다.

\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}

s_i

표본 i의 표준편차입니다.

평균 차이에 대한 신뢰 구간의 구체적인 예

평균 차이에 대한 신뢰 구간의 정의와 다양한 공식이 무엇인지 살펴본 후 이제 두 평균 차이에 대한 신뢰 구간이 계산되는 방법을 익히기 위한 구체적인 예를 살펴보겠습니다.

  • 우리는 담배가 어린이의 출생 체중에 미치는 영향을 연구하고 싶습니다. 이를 위해 두 개의 샘플을 비교합니다. 첫 번째 샘플은 어머니가 담배를 피우지 않은 어린이로 구성되고 두 번째 샘플은 어머니가 담배를 피우는 어린이로 구성됩니다(샘플 매개변수는 아래에 표시됨). 신뢰 수준 95%를 사용하여 평균 차이에 대한 신뢰 구간을 계산합니다.
    1. 비흡연 엄마:

      \overline{x_1}=3,1 \ kg \quad s_1=0,6 \ kg \quad n_1=39

    2. 흡연하는 엄마들:

      \overline{x_2}=3,5 \ kg \quad s_2=0,4 \ kg\quad n_2=43

이 경우 모집단 분산의 값을 알 수 없지만 매우 유사한 특성을 가진 두 모집단을 다루고 있기 때문에 모집단 분산이 동일하다고 가정할 수 있습니다. 따라서 우리가 사용해야 하는 평균의 차이에 대한 신뢰 구간 공식은 다음과 같습니다.

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

따라서 두 표본의 표준 편차로부터 결합된 표준 편차를 계산합니다.

\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(39-1)\cdot 0,6^2+(43-1)\cdot 0,4^2}{39+43-2}}\\[2ex]\displaystyle s_p&=0,50\end{aligned}

마찬가지로, 스튜던트 t 분포의 확률 분포표에서 2.5%의 확률로 80 자유도의 스튜던트 t 분포 값을 찾아야 합니다.

1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025|80}=1,990\end{array}

마지막으로 데이터를 평균 차이에 대한 신뢰 구간 공식으로 대체하고 계산을 수행합니다.

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

\displaystyle (3,1-3,5)\pm 1,990\cdot 0,5\cdot\sqrt{\frac{1}{39}+\frac{1}{43}}

\displaystyle -0,4\pm 0,22

따라서 문제 평균의 차이에 대한 신뢰 구간은 다음과 같습니다.

(-0,61,-0,18)

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다