3원 분산분석: 정의 및 예
3원 분산분석은 세 가지 요인이 반응 변수에 어떻게 영향을 미치는지 확인하는 데 사용됩니다.
3원 분산 분석은 일원 분산 분석 (요인이 1개만 포함)이나 이원 분산 분석 (요인이 2개만 포함)보다 덜 일반적이지만 여전히 다양한 분야에서 사용됩니다.
3원 분산 분석을 수행할 때마다 우리는 각 요인과 반응 변수 사이에 통계적으로 유의미한 관계가 있는지, 요인 간에 상호 작용 효과가 있는지 알고 싶습니다.
이 튜토리얼에서는 3원 분산 분석을 사용할 수 있는 여러 시나리오와 이를 수행하는 방법의 예를 보여줍니다.
3원 분산분석을 사용하는 경우
3원 분산분석을 사용할 수 있는 몇 가지 시나리오는 다음과 같습니다.
시나리오 1: 식물학
식물학자는 (1) 햇빛 노출, (2) 물 주는 빈도, (3) 비료 유형이 식물 성장에 어떤 영향을 미치는지 확인하려고 할 수 있습니다.
이 시나리오에서는 요인이 세 개이고 반응 변수가 하나이므로 삼원 분산 분석을 수행할 수 있습니다.
시나리오 2: 소매
소매점 관리자는 (1) 요일, (2) 매장 위치, (3) 광고 캠페인이 총 매출에 어떤 영향을 미치는지 확인하려고 할 수 있습니다.
이 시나리오에서는 3개의 요인과 1개의 반응 변수가 있으므로 3원 분산 분석을 수행할 수 있습니다.
시나리오 3: 의료
의사는 (1) 성별, (2) 식이 요법, (3) 운동 습관이 체중에 어떤 영향을 미치는지 확인하려고 할 수 있습니다.
이 시나리오에서는 요인이 세 개이고 반응 변수가 하나이므로 삼원 분산 분석을 수행할 수 있습니다.
3원 분산분석: 예
연구자가 훈련 프로그램, 성별, 스포츠 부문이 점프 높이에 영향을 미치는지 확인하려고 한다고 가정해 보겠습니다.
이를 테스트하기 위해 그는 다음 요소를 사용하여 3원 분산 분석을 수행할 수 있습니다.
- 1. 교육 프로그램 (프로그램 1 vs 프로그램 2)
- 2. 성별 (남성 또는 여성)
- 3. 스포츠 부문 (디비전 I 대 디비전 II)
유일한 응답 변수는 점프 높이 입니다.
그가 40명의 사람에 대해 다음 데이터를 수집한다고 가정해 보겠습니다.
그런 다음 그는 통계 소프트웨어를 사용하여 3원 분산 분석을 수행하고 다음 결과를 얻습니다.
P-값 열에는 각 개별 요인에 대한 P-값과 요인 간의 상호 작용이 표시됩니다.
결과를 보면, 세 가지 요인 간의 상호작용 중 어느 것도 통계적으로 유의미하지 않음을 알 수 있습니다.
또한 세 가지 요인(프로그램, 성별, 부문)이 각각 통계적으로 유의미한 것을 확인할 수 있습니다.
결론적으로, 훈련 프로그램, 성별, 부문은 모두 선수의 점프 높이 증가를 나타내는 중요한 지표라고 말할 수 있습니다.
또한 이 세 가지 요소 사이에는 유의미한 상호작용 효과가 없다고 말할 수 있습니다.
참고 : 실제로는 각 요인의 어느 수준이 점프 높이 증가와 연관되어 있는지 결정할 수 있도록 각 프로그램, 성별 및 부문에 대한 평균 점프 높이도 계산합니다.
추가 리소스
다음 튜토리얼에서는 R 및 Python에서 3원 ANOVA를 수행하는 방법을 설명합니다.