피어슨 잔차란 무엇입니까? (정의 & #038; 예)


Pearson 잔차는 분할표에서 관찰된 세포 수와 예상된 세포 수 간의 차이를 분석하기 위해 카이제곱 독립성 검정 에 사용됩니다.

Pearson 잔차를 계산하는 공식은 다음과 같습니다.

r ij = (O ij – E ij ) / √ E ij

금:

  • r ij : i 번째 열과 j 번째 행의 셀에 대한 Pearson 잔차
  • O ij : i 번째 열과 j 번째 행의 셀에 대해 관찰된 값
  • E ij : i 번째 열, j 번째 행의 셀에 대한 기대값

비슷한 측정값으로 표준화된(수정된) Pearson 잔차가 있으며, 이는 다음과 같이 계산됩니다.

r ij = (O ij – E ij ) / √ E ij (1-n i+ )(1-n +j )

금:

  • r ij : i 번째 열과 j 번째 행의 셀에 대한 Pearson 잔차
  • O ij : i 번째 열과 j 번째 행의 셀에 대해 관찰된 값
  • E ij : i 번째 열, j 번째 행의 셀에 대한 기대값
  • p i+ : 행 합계를 총합계로 나눈 값
  • p + j : 열 합계를 총합계로 나눈 값

표준화된 Pearson 잔차는 평균이 0이고 표준 편차가 1인 정규 분포입니다. 절대값이 특정 임계값(예: 2 또는 3)보다 큰 표준화된 Pearson 잔차는 적합성이 부족함을 나타냅니다.

다음 예에서는 실제로 Pearson 잔차를 계산하는 방법을 보여줍니다.

예: Pearson 잔차 계산

연구자가 성별이 정당 선호와 연관되어 있는지 여부를 확인하기 위해 카이제곱 독립성 검정을 사용한다고 가정해 보겠습니다.

그들은 유권자 500명의 단순 무작위 표본을 추출하여 선호하는 정당에 대해 질문하기로 결정했습니다.

다음 비상표는 설문 조사 결과를 나타냅니다.

공화주의자 민주당 독립적인
남성 120 90 40 250
여성 110 95 45 250
230 185 85 500

Pearson 잔차를 계산하기 전에 먼저 분할표의 각 셀에 대한 기대 개수를 계산해야 합니다. 이를 위해 다음 공식을 사용할 수 있습니다.

예상 값 = (행 합계 * 열 합계) / 테이블 합계.

예를 들어, 공화당 남성의 기대값은 (230*250) / 500 = 115 입니다.

이 공식을 반복하여 각 테이블 셀의 예상 값을 얻을 수 있습니다.

공화주의자 민주당 독립적인
남성 115 92.5 42.5 250
여성 115 92.5 42.5 250
230 185 85 500

그런 다음 테이블의 각 셀에 대한 Pearson 잔차를 계산할 수 있습니다.

예를 들어 공화당 남성이 포함된 셀에 대한 Pearson 잔차는 다음과 같이 계산됩니다.

  • r ij = (O ij – E ij ) / √ E ij
  • r ij = (120 – 115) / √ 115
  • rij = 0.466

이 공식을 반복하여 테이블의 각 셀에 대한 Pearson 잔차를 얻을 수 있습니다.

공화주의자 민주당 독립적인
남성 0.446 -0.259 -0.383
여성 -0.446 0.259 0.383

그런 다음 표의 각 셀에 대해 표준화된 Pearson 잔차를 계산할 수 있습니다.

예를 들어, 공화당 남성이 포함된 셀에 대한 표준화된 Pearson 잔차는 다음과 같이 계산됩니다.

  • r ij = (O ij – E ij ) / √ E ij (1-p i+ )(1-p +j )
  • r ij = (120 – 115) / √ 115(1-250/500)(1-230/500)
  • rij = 0.897

이 공식을 반복하여 표의 각 셀에 대한 표준화된 Pearson 잔차를 얻을 수 있습니다.

공화주의자 민주당 독립적인
남성 0.897 -0.463 -0.595
여성 -0.897 0.463 0.595

표준화된 Pearson 잔차 중 절대값이 3보다 큰 것이 없음을 알 수 있습니다. 이는 어떤 셀도 유의미한 적합성 결여에 기여하지 않음을 나타냅니다.

이 온라인 계산기를 사용하여 카이제곱 독립성 테스트를 수행하면 테스트의 p-값이 0.649198 이라는 것을 알 수 있습니다.

이 p-값은 0.05 이상이므로 성별과 정당 선호도 사이에 연관성이 있다고 말할 수 있는 충분한 증거가 없습니다.

추가 리소스

다음 자습서에서는 다양한 통계 소프트웨어를 사용하여 카이제곱 독립성 검정을 수행하는 방법을 설명합니다.

카이제곱 독립성 검정 소개
Excel에서 카이제곱 독립성 검정을 수행하는 방법
R에서 카이제곱 독립성 테스트를 수행하는 방법
독립성 계산기의 카이제곱 검정

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다