Anova 모델에서 잔차를 분석하는 방법


ANOVA (“분산 분석”)는 3개 이상의 독립 그룹 평균 간에 유의한 차이가 있는지 여부를 확인하는 데 사용되는 모델 유형입니다.

모델을 데이터 세트에 적용할 때마다 ANOVA를 적용할 때마다 잔차가 항상 존재합니다. 이는 각 개별 관측치와 관측치가 나온 그룹 평균 간의 차이를 나타냅니다.

다음 예에서는 실제로 ANOVA 모델의 잔차를 계산하는 방법을 보여줍니다.

예: ANOVA의 잔차 계산

한 달 동안 프로그램 A, 프로그램 B 또는 프로그램 C를 따르도록 무작위로 30명을 할당하는 체중 감량 실험에 참여할 90명을 모집한다고 가정합니다.

일원 분산 분석을 수행하여 세 가지 프로그램으로 인한 체중 감량 간에 통계적으로 유의미한 차이가 있는지 확인할 수 있습니다.

각 프로그램에 참여한 개인의 평균 체중 감소를 다음과 같이 계산한다고 가정해 보겠습니다.

  • 프로그램 A : 1.58파운드
  • 프로그램 B : 2.56파운드
  • 프로그램 C : 4.13파운드

ANOVA 모델의 잔차는 각 개인의 체중 감소와 프로그램의 평균 체중 감소 간의 차이입니다.

예를 들어, 다음 표는 연구에 참여한 10명의 개인에 대한 잔차를 계산하는 방법을 보여줍니다.

다음 패턴을 참고하세요.

  • 그룹 평균보다 높은 값을 가진 개인은 양의 잔차를 가졌습니다.
  • 그룹 평균보다 낮은 값을 가진 개인은 음의 잔차를 가졌습니다.

실제로는 90명 모두에 대한 잔차를 계산합니다.

잔차를 사용하여 정규성을 확인하는 방법

ANOVA의 가정 중 하나는 잔차가 정규 분포를 따른다는 것입니다.

이 가정을 검증하는 가장 일반적인 방법은 QQ 플롯을 만드는 것입니다.

잔차가 정규 분포를 따르는 경우 QQ 플롯의 점은 직선 대각선에 놓이게 됩니다.

이전 예의 QQ 플롯은 다음과 같습니다.

꼬리 끝 부분의 직선 대각선에서 팁이 약간 벗어나지만 일반적으로 팁이 대각선을 따라 잘 떨어집니다. 이는 정규성 가정이 충족될 가능성이 높다는 것을 말해줍니다.

참고로 비정규 분포 잔차에 대한 QQ 플롯은 다음과 같습니다.

점들이 직선 대각선에서 크게 벗어나 있어 잔차가 정규 분포를 따르지 않음을 나타냅니다.

다양한 소프트웨어에서 QQ 플롯을 생성하는 방법을 알아보려면 다음 튜토리얼을 참조하십시오.

추가 리소스

다음 문서에서는 ANOVA 모델에 대한 추가 정보를 제공합니다.

일원 분산 분석 소개
ANOVA 가정을 확인하는 방법
실생활에서 ANOVA를 활용한 4가지 예

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다