비율 차이의 샘플링 분포

이 글에서는 비율표본분포의 차이가 무엇인지, 통계에서 어떤 용도로 사용되는지 설명합니다. 비율의 차이 샘플링 분포 공식과 단계별 해결 연습도 제시됩니다.

비율 차이의 샘플링 분포는 무엇입니까?

비율 표본 추출 분포의 차이는 서로 다른 두 모집단에서 추출한 가능한 모든 표본의 표본 추출 비율 간의 차이를 계산하여 얻은 분포입니다.

즉, 비율 차이의 표본분포를 구하는 과정은 먼저 서로 다른 두 모집단에서 가능한 모든 표본을 추출하고, 두 번째로 추출된 각 표본의 비율을 구하고, 마지막으로 전체 표본 간의 차이를 구하는 과정이다. 비율의 차이의 비율. 두 개의 인구. 따라서 이러한 작업을 수행한 후 얻은 결과 집합은 비율 차이의 샘플링 분포를 형성합니다.

비율 차이의 샘플링 분포

통계에서는 무작위로 선택된 두 표본의 표본 비율 차이가 모집단 비율 의 차이에 가까울 확률을 계산하기 위해 표본 추출 분포 비율의 차이를 사용합니다.

참고: 비례표본 할당

비율 차이의 샘플링 분포 공식

비율 표본 추출 분포의 차이를 위해 선택된 표본은 이항 분포 로 정의됩니다. 왜냐하면 실용적인 목적으로 비율은 전체 관측치 수에 대한 성공적인 사례의 비율이기 때문입니다.

그럼에도 불구하고 중심 극한 정리로 인해 이항 분포는 정규 확률 분포 에 근접할 수 있습니다. 따라서 비율 차이의 표본분포는 다음과 같은 특징을 갖는 정규분포에 근접할 수 있습니다.

\begin{array}{c}\displaystyle\mu_{\widehat{p_1}-\widehat{p_2}}=p_1-p_2 \qquad \sigma_{\widehat{p_1}-\widehat{p_2}}=\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}\\[6ex]\displaystyle N_{p}\left(p_1-p_2, \sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}\right) \end{array}

참고: 비율 차이의 샘플링 분포는 다음과 같은 경우에만 정규 분포에 근접할 수 있습니다.

n_1\geq30

,

n_2\geq 30

,

n_1p_1\geq5

,

n_2p_2\geq5

,

n_1q_1\geq5

그리고

n_2q_2\geq5

.

따라서 비율차의 표본분포는 정규분포에 근접할 수 있으므로 비율차의 표본분포 통계량을 계산하는 공식은 다음과 같다.

Z=\cfrac{(\widehat{p_1}-\widehat{p_2})-(p_1-p_2)}{\displaystyle\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}}

금:

  • \widehat{p_i}

    표본 비율 i입니다.

  • p_i

    인구 i의 비율입니다.

  • q_i

    모집단 i의 실패 확률은 다음과 같습니다.

    q_i=1-p_i

    .

  • n_i

    표본 크기는 i입니다.

  • Z

    는 표준 정규 분포 N(0,1)에 의해 정의되는 변수입니다.

이 공식은 비율 차이에 대한 가설 검정 공식과 유사합니다.

비율차의 표본분포의 구체적인 예

비율차 표본분포의 정의와 그 공식이 무엇인지 확인한 후, 아래에서 단계별로 해결된 예를 확인하여 개념 이해를 완료할 수 있습니다.

  • 두 생산 공장의 정확도를 분석하려고 합니다. 한 공장에서는 생산된 부품의 5%에만 결함이 있는 반면 다른 공장에서는 결함 부품 비율이 8%인 방식으로 생산합니다. 첫 번째 공장에서 200개 부품 샘플을 채취하고 두 번째 공장에서 280개 부품 샘플을 추출하면 첫 번째 생산 공장의 결함 비율이 두 번째 공장의 결함 비율보다 클 확률은 얼마입니까? 생산?

문제의 모든 데이터를 파악하기 위해 먼저 각 공장에서 잘 생산된 부품의 비율을 계산합니다.

\begin{array}{c}q_1=1-p_1=1-0,05=0,95\\[2ex]q_2=1-p_2=1-0,08=0,92\end{array}

첫 번째 공장의 불량률이 두 번째 공장의 불량률보다 크다면 이는 다음 방정식이 성립함을 의미합니다.

\widehat{p_1}-\widehat{p_2}>0″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”89″ style=”vertical-align: -4px;”></p>
</p>
<p> 따라서 비율 차이의 샘플링 분포 확률을 결정하려면 위 섹션에서 설명한 공식을 적용해야 합니다.</p>
</p>
<p class=Z=\cfrac{(\widehat{p_1}-\widehat{p_2})-(p_1-p_2)}{\displaystyle\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}}=\cfrac{0-(0,05-0,08)}{\displaystyle\sqrt{\frac{0,05\cdot 0,95}{200}+\frac{0,08\cdot 0,92}{280}}}=1,34

따라서 첫 번째 공장의 불량률이 두 번째 공장의 불량률보다 클 확률은 변수 Z가 1.34보다 클 확률과 동일합니다.

P[(\widehat{p_1}-\widehat{p_2})>0]=P[Z>1,34]” title=”Rendered by QuickLaTeX.com” height=”19″ width=”242″ style=”vertical-align: -5px;”></p>
</p>
<p> 마지막으로 <a href=정규 분포표 에서 해당 확률을 찾으면 이미 문제를 해결했을 것입니다.

P[(\widehat{p_1}-\widehat{p_2})>0]=P[Z>1,34]=0,0901″ title=”Rendered by QuickLaTeX.com” height=”19″ width=”319″ style=”vertical-align: -5px;”></p>
</p>
<p> 즉, 첫 번째 공장의 불량률이 두 번째 공장의 불량률보다 클 확률은 9.01%입니다. </p>
<div style= 참고: 평균 차이의 표본 분포

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다