카이제곱 검정

이 기사에서는 통계의 카이제곱 검정이 무엇인지, 그리고 그 용도에 대해 설명합니다. 또한 카이제곱 테스트를 수행하는 방법과 더불어 단계별 해결 방법도 알아봅니다.

카이제곱 검정이란 무엇입니까?

카이제곱 검정은 기대 빈도와 관찰 빈도 사이에 통계적으로 유의미한 차이가 있는지 확인하는 데 사용되는 통계 검정입니다.

논리적으로 카이제곱 검정 통계량은 카이제곱 분포를 따릅니다. 따라서 검정 통계량의 값은 카이제곱 분포의 특정 값과 비교되어야 합니다. 아래에서는 카이제곱 테스트가 어떻게 수행되는지 살펴보겠습니다.

이러한 유형의 통계 검정은 Pearson 카이제곱 검정 이라고도 하며 때로는 카이제곱 분포 기호인 χ² 검정 으로 표시됩니다.

카이제곱 검정 공식

카이제곱 검정 통계량은 관측값과 기대값 간의 차이의 제곱을 기대값으로 나눈 값의 합과 같습니다.

따라서 카이제곱 검정의 공식은 다음과 같습니다.

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

금:

  • \chi^2

    카이제곱 검정 통계량은 다음과 같은 카이제곱 분포를 따릅니다.

    k-1

    자유도.

  • k

    데이터 샘플 크기입니다.

  • O_i

    데이터 i에 대해 관찰된 값입니다.

  • E_i

    데이터 i의 기대값입니다.

카이제곱 검정을 검정하는 가설의 귀무가설은 관측값이 기대값과 동일하다는 것입니다. 반면, 검정의 대립가설은 관측값 중 하나가 기대값과 다르다는 것입니다.

\begin{cases}H_0:O_i=E_i \quad \forall i\\[2ex]H_1:\exists \ O_i\neq E_i \end{cases}

따라서 유의미한 수준이 주어지면

\alpha

, 계산된 검정 통계량을 임계 검정 값과 비교하여 귀무 가설을 기각할지 대립 가설을 기각할지 결정해야 합니다.

  • 테스트 통계가 임계값보다 작은 경우

    \chi_{1-\alpha|k-1}^2

    이면 대립가설이 기각되고 귀무가설이 채택됩니다.

  • 테스트 통계량이 임계값보다 큰 경우

    \chi_{1-\alpha|k-1}^2

    이면 귀무가설이 기각되고 대립가설이 채택됩니다.

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}” title=”Rendered by QuickLaTeX.com” height=”70″ width=”243″ style=”vertical-align: 0px;”></p>
</p>
<h2 class= 카이제곱 검정의 예

카이 제곱 테스트의 정의와 공식을 확인한 후 이러한 유형의 통계 테스트가 어떻게 수행되는지 확인할 수 있도록 단계별로 해결된 예가 아래에 제시됩니다.

  • 한 상점 주인이 매출의 50%가 제품 A, 35%가 제품 B, 15%가 제품 C라고 말합니다. 그러나 각 제품의 판매 수량은 표시된 수량입니다. 다음 우발표 에서. 발주자의 이론적인 데이터가 실제 수집된 데이터와 통계적으로 다른지 분석합니다.
제품 관측된 매출 (O i )
제품 A 453
제품 B 268
제품 C 79
800

먼저, 가게 주인이 기대하는 가치를 계산해야 합니다. 이를 위해 각 제품의 예상 판매량 비율에 달성된 총 판매량을 곱합니다.

\begin{array}{c}E_A=800\cdot 0,5=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

따라서 문제의 빈도분포표는 다음과 같다.

제품 관측된 매출 (O i ) 기대매출 (E i )
제품 A 453 400
제품 B 268 280
제품C 79 120
800 800

이제 모든 값을 계산했으므로 카이제곱 검정 공식을 적용하여 검정 통계량을 계산합니다.

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

검정 통계량의 값이 계산되면 카이제곱 분포표를 사용하여 검정의 임계값을 찾습니다. 카이제곱 분포는 다음과 같습니다.

k-1=3-1=2

자유도이므로 유의성 수준을 선택하면

\alpha=0,05

테스트의 임계값은 다음과 같습니다.

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

따라서 검정 통계량(21.53)이 임계 검정 값(5.991)보다 크므로 귀무가설이 기각되고 대립가설이 채택됩니다. 이는 데이터가 매우 다르기 때문에 매장 주인이 실제 매출과 다른 매출을 기대했다는 의미입니다.

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0″ title=”Rendered by QuickLaTeX.com” height=”17″ width=”354″ style=”vertical-align: -4px;”></p>
</p>
<h2 class= 카이제곱 검정의 해석

카이제곱 검정의 해석은 얻은 검정 결과만으로는 해석할 수 없으며 검정의 임계값과 비교해야 합니다.

논리적으로 계산된 검정 통계량의 값이 작을수록 관찰된 데이터가 예상 데이터와 더 유사합니다. 따라서 카이제곱 검정 결과가 0이면 관측값과 기대값이 정확히 일치한다는 의미입니다. 한편, 테스트 결과가 클수록 관측값이 기대값과 더 많이 다르다는 의미입니다.

그러나 두 데이터 세트가 통계적으로 다르거나 같은지 여부를 결정하려면 대비에 대한 귀무 가설 또는 대립 가설을 기각하기 위해 계산된 테스트 값을 임계 테스트 값과 비교해야 합니다. 검정 통계량이 분포의 임계값보다 작으면 대립 가설이 기각됩니다. 반면, 검정 통계량이 분포의 임계값보다 크면 귀무가설이 기각됩니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다