3원 분산분석: 정의 및 예


3원 분산분석은 세 가지 요인이 반응 변수에 어떻게 영향을 미치는지 확인하는 데 사용됩니다.

3원 분산 분석은 일원 분산 분석 (요인이 1개만 포함)이나 이원 분산 분석 (요인이 2개만 포함)보다 덜 일반적이지만 여전히 다양한 분야에서 사용됩니다.

3원 분산 분석을 수행할 때마다 우리는 각 요인과 반응 변수 사이에 통계적으로 유의미한 관계가 있는지, 요인 간에 상호 작용 효과가 있는지 알고 싶습니다.

이 튜토리얼에서는 3원 분산 분석을 사용할 수 있는 여러 시나리오와 이를 수행하는 방법의 예를 보여줍니다.

3원 분산분석을 사용하는 경우

3원 분산분석을 사용할 수 있는 몇 가지 시나리오는 다음과 같습니다.

시나리오 1: 식물학

식물학자는 (1) 햇빛 노출, (2) 물 주는 빈도, (3) 비료 유형이 식물 성장에 어떤 영향을 미치는지 확인하려고 할 수 있습니다.

이 시나리오에서는 요인이 세 개이고 반응 변수가 하나이므로 삼원 분산 분석을 수행할 수 있습니다.

시나리오 2: 소매

소매점 관리자는 (1) 요일, (2) 매장 위치, (3) 광고 캠페인이 총 매출에 어떤 영향을 미치는지 확인하려고 할 수 있습니다.

이 시나리오에서는 3개의 요인과 1개의 반응 변수가 있으므로 3원 분산 분석을 수행할 수 있습니다.

시나리오 3: 의료

의사는 (1) 성별, (2) 식이 요법, (3) 운동 습관이 체중에 어떤 영향을 미치는지 확인하려고 할 수 있습니다.

이 시나리오에서는 요인이 세 개이고 반응 변수가 하나이므로 삼원 분산 분석을 수행할 수 있습니다.

3원 분산분석: 예

연구자가 훈련 프로그램, 성별, 스포츠 부문이 점프 높이에 영향을 미치는지 확인하려고 한다고 가정해 보겠습니다.

이를 테스트하기 위해 그는 다음 요소를 사용하여 3원 분산 분석을 수행할 수 있습니다.

  • 1. 교육 프로그램 (프로그램 1 vs 프로그램 2)
  • 2. 성별 (남성 또는 여성)
  • 3. 스포츠 부문 (디비전 I 대 디비전 II)

유일한 응답 변수는 점프 높이 입니다.

그가 40명의 사람에 대해 다음 데이터를 수집한다고 가정해 보겠습니다.

그런 다음 그는 통계 소프트웨어를 사용하여 3원 분산 분석을 수행하고 다음 결과를 얻습니다.

삼원 분산분석표

P-값 열에는 각 개별 요인에 대한 P-값과 요인 간의 상호 작용이 표시됩니다.

결과를 보면, 세 가지 요인 간의 상호작용 중 어느 것도 통계적으로 유의미하지 않음을 알 수 있습니다.

또한 세 가지 요인(프로그램, 성별, 부문)이 각각 통계적으로 유의미한 것을 확인할 수 있습니다.

결론적으로, 훈련 프로그램, 성별, 부문은 모두 선수의 점프 높이 증가를 나타내는 중요한 지표라고 말할 수 있습니다.

또한 이 세 가지 요소 사이에는 유의미한 상호작용 효과가 없다고 말할 수 있습니다.

참고 : 실제로는 각 요인의 어느 수준이 점프 높이 증가와 연관되어 있는지 결정할 수 있도록 각 프로그램, 성별 및 부문에 대한 평균 점프 높이도 계산합니다.

추가 리소스

다음 튜토리얼에서는 R 및 Python에서 3원 ANOVA를 수행하는 방법을 설명합니다.

R에서 3원 분산분석을 수행하는 방법
Python에서 3원 ANOVA를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다