전체 가이드: manova 가정을 확인하는 방법


MANOVA (다변량 분산 분석)는 하나 이상의 요인 변수가 여러 반응 변수에 어떻게 영향을 미치는지 분석하는 데 사용됩니다.

예를 들어, MANOVA를 사용하여 교육 수준(고등학교 졸업장, 준학사 학위, 학사 학위, 석사 학위)이 연간 소득과 총 학자금 대출 부채에 어떻게 영향을 미치는지 분석할 수 있습니다.

관련 항목: ANOVA, ANCOVA, MANOVA 및 MANCOVA의 차이점

MANOVA를 수행할 때마다 다음 가정이 충족되는지 확인해야 합니다.

1. 다변량 정규성 – 반응 변수는 각 요인 변수 그룹 내에서 다변량 정규 분포를 따릅니다.

2. 독립성 – 각 관측값은 모집단에서 무작위로 독립적으로 샘플링됩니다.

3. 등분산 – 각 그룹의 모집단 공분산 행렬이 동일합니다.

4. 다변량 이상치가 없습니다 . 극단적인 다변량 이상치가 없습니다.

이 기사에서는 각 가정에 대한 설명과 가정이 충족되는지 확인하는 방법을 제공합니다.

가정 1: 다변량 정규성

MANOVA에서는 반응 변수가 요인 변수의 각 그룹 내에서 정규 분포를 따르는 다변량이라고 가정합니다.

각 요인 * 반응 변수 조합에 대해 최소 20개의 관측치가 있는 경우 다변량 정규성 가정이 충족된다고 가정할 수 있습니다.

각 요인*반응 변수 조합에 대한 관측치가 20개 미만인 경우 산점도 행렬을 만들어 잔차를 시각화하고 이 가정이 충족되는지 시각적으로 확인할 수 있습니다.

다행히도 MANOVA는 다변량 정규성 편차에 강인하다는 것이 잘 알려져 있으므로 작거나 중간 정도의 편차는 일반적으로 문제가 되지 않습니다.

가설 2: 독립성

MANOVA에서는 각 관측치가 모집단에서 무작위로 독립적으로 샘플링된다고 가정합니다.

확률 샘플링 방법 (모집단의 각 구성원이 표본으로 선택될 확률이 동일함)을 사용하여 데이터를 수집하는 한, 각 관측값은 무작위적이고 독립적인 방식으로 샘플링되었다고 가정할 수 있습니다.

확률 샘플링 방법의 예는 다음과 같습니다.

  • 단순 무작위 샘플링
  • 층화된 무작위 샘플링
  • 무작위 클러스터 샘플링
  • 체계적인 무작위 샘플링

가정 3: 등분산

MANOVA는 각 그룹의 모집단 공분산 행렬이 동일하다고 가정합니다.

이 가설을 테스트하는 가장 일반적인 방법은 Box의 M 테스트를 사용하는 것입니다. 이 테스트는 매우 엄격한 것으로 알려져 있으므로 일반적으로 모집단 공분산 행렬이 같은지 여부를 확인하기 위해 유의 수준 0.001을 사용합니다.

Box의 M 검정의 p-값이 0.001보다 크면 이 가정이 충족된다고 가정할 수 있습니다.

다행스럽게도 검정의 p-값이 0.001보다 작더라도 MANOVA는 이 가설의 편차에 대해 견고한 경향이 있습니다.

동일하지 않은 공분산 행렬이 문제가 되려면 공분산 행렬 간의 차이가 상당히 커야 합니다.

가설 4: 다변량 이상값이 없습니다.

MANOVA는 결과에 큰 영향을 미칠 수 있는 극단적인 다변량 이상치가 데이터에 존재하지 않는다고 가정합니다.

이 가정을 검증하는 가장 일반적인 방법은 다변량 공간에서 두 점 사이의 거리를 나타내는 각 관측값에 대한 Mahalanobis 거리를 계산하는 것입니다.

관측치의 Mahalanobis 거리에 해당하는 p-값이 0.001보다 작으면 일반적으로 해당 관측치를 극단적인 특이치로 선언합니다.

다양한 통계 소프트웨어에서 Mahalanobis 거리를 계산하는 방법을 보려면 다음 튜토리얼을 참조하십시오.

추가 리소스

다음 튜토리얼에서는 다양한 통계 소프트웨어에서 MANOVA를 수행하는 방법을 설명합니다.

R에서 MANOVA를 수행하는 방법
SPSS에서 MANOVA를 수행하는 방법
Stata에서 MANOVA를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다