Anova에서 높은 f 값은 무엇을 의미합니까?
일원 분산 분석은 3개 이상의 독립 그룹의 평균이 동일한지 여부를 확인하는 데 사용됩니다.
일원 분산 분석에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.
- H 0 : 모든 그룹 평균이 동일합니다.
- H A : 적어도 한 그룹의 평균은 다른 그룹의 평균과 다릅니다.
일원 분산 분석을 수행할 때마다 다음과 같은 요약 테이블이 생성됩니다.
| 원천 | 제곱합(SS) | df | 평균 제곱(MS) | 에프 | P-값 |
|---|---|---|---|---|---|
| 치료 | 192.2 | 2 | 96.1 | 2,358 | 0.1138 |
| 오류 | 1100.6 | 27 | 40.8 | ||
| 총 | 1292.8 | 29 |
표의 F 값은 다음과 같이 계산됩니다.
- F 값 = 평균 제곱 처리 / 평균 제곱 오류
이를 작성하는 또 다른 방법은 다음과 같습니다.
- F-값 = 표본 평균 간 변동 / 표본 내 변동
표본 평균 간의 변동이 각 표본 내 변동에 비해 높으면 F 값이 커집니다.
예를 들어 위 표의 F 값은 다음과 같이 계산됩니다.
- F값 = 96.1 / 40.8 = 2.358
이 F-값에 해당하는 p-값을 찾기 위해 분자의 자유도 = df 처리, 분모의 자유도 = df 오류인 F-분포 계산기를 사용할 수 있습니다.
예를 들어 F-값 2.358, 분자 df = 2, 분모 df = 27에 해당하는 p-값은 0.1138 입니다.
이 p-값은 α = 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 세 그룹의 평균 간에 통계적으로 유의미한 차이가 없음을 의미합니다.
ANOVA의 F 값 보기
ANOVA 테이블의 F 값을 직관적으로 이해하려면 다음 예를 고려하십시오.
세 가지 다른 학습 기술이 서로 다른 평균 시험 점수를 생성하는지 여부를 확인하기 위해 일원 분산 분석을 수행한다고 가정해 보겠습니다. 다음 표는 각 기술을 사용한 10명의 학생의 시험 결과를 보여줍니다.

다음 차트를 만들어 그룹별 시험 결과를 시각화할 수 있습니다.

샘플 내 변동은 각 개별 샘플 내의 값 분포로 표시됩니다.

표본 간의 변동은 표본 평균 간의 차이로 표시됩니다.

이 데이터 세트에 대해 일원 분산 분석을 수행하면 F 값은 2.358 이고 해당 p 값은 0.1138 입니다.
이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 사용한 연구 기법이 평균 시험 점수에 통계적으로 유의미한 차이를 가져온다고 말할 수 있는 증거가 충분하지 않음을 의미합니다.
즉, 이는 표본 평균 간의 변동이 귀무 가설을 기각할 만큼 표본 내 변동에 비해 충분히 높지 않음을 나타냅니다.
결론
이 글의 주요 내용을 간략하게 요약하면 다음과 같습니다.
- ANOVA의 F 값은 표본 평균 간의 변동 / 표본 내 변동으로 계산됩니다.
- ANOVA에서 F 값이 높을수록 표본 내 변동에 비해 표본 평균 간의 변동이 더 커집니다.
- F 값이 높을수록 해당 p 값은 낮아집니다.
- p-값이 특정 임계값(예: α = 0.05)보다 낮으면 ANOVA의 귀무 가설을 기각하고 그룹 평균 간에 통계적으로 유의한 차이가 있다는 결론을 내릴 수 있습니다.
추가 리소스
Excel에서 일원 분산 분석을 수행하는 방법
일원 분산 분석을 수동으로 수행하는 방법
일원 분산 분석 계산기