Anova에서 높은 f 값은 무엇을 의미합니까?

에 의해 벤자민 앤더슨 7월 25, 2023 가이드 댓글 0개

일원 분산 분석은 3개 이상의 독립 그룹의 평균이 동일한지 여부를 확인하는 데 사용됩니다.

일원 분산 분석에서는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.

일원 분산 분석을 수행할 때마다 다음과 같은 요약 테이블이 생성됩니다.

원천	제곱합(SS)	df	평균 제곱(MS)	에프	P-값
치료	192.2	2	96.1	2,358	0.1138
오류	1100.6	27	40.8
총	1292.8	29

표의 F 값은 다음과 같이 계산됩니다.

이를 작성하는 또 다른 방법은 다음과 같습니다.

표본 평균 간의 변동이 각 표본 내 변동에 비해 높으면 F 값이 커집니다.

예를 들어 위 표의 F 값은 다음과 같이 계산됩니다.

이 F-값에 해당하는 p-값을 찾기 위해 분자의 자유도 = df 처리, 분모의 자유도 = df 오류인 F-분포 계산기를 사용할 수 있습니다.

예를 들어 F-값 2.358, 분자 df = 2, 분모 df = 27에 해당하는 p-값은 0.1138 입니다.

이 p-값은 α = 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 세 그룹의 평균 간에 통계적으로 유의미한 차이가 없음을 의미합니다.

ANOVA 테이블의 F 값을 직관적으로 이해하려면 다음 예를 고려하십시오.

세 가지 다른 학습 기술이 서로 다른 평균 시험 점수를 생성하는지 여부를 확인하기 위해 일원 분산 분석을 수행한다고 가정해 보겠습니다. 다음 표는 각 기술을 사용한 10명의 학생의 시험 결과를 보여줍니다.

다음 차트를 만들어 그룹별 시험 결과를 시각화할 수 있습니다.

샘플 내 변동은 각 개별 샘플 내의 값 분포로 표시됩니다.

표본 간의 변동은 표본 평균 간의 차이로 표시됩니다.

이 데이터 세트에 대해 일원 분산 분석을 수행하면 F 값은 2.358 이고 해당 p 값은 0.1138 입니다.

이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 사용한 연구 기법이 평균 시험 점수에 통계적으로 유의미한 차이를 가져온다고 말할 수 있는 증거가 충분하지 않음을 의미합니다.

즉, 이는 표본 평균 간의 변동이 귀무 가설을 기각할 만큼 표본 내 변동에 비해 충분히 높지 않음을 나타냅니다.

이 글의 주요 내용을 간략하게 요약하면 다음과 같습니다.

ANOVA의 F 값은 표본 평균 간의 변동 / 표본 내 변동으로 계산됩니다.
ANOVA에서 F 값이 높을수록 표본 내 변동에 비해 표본 평균 간의 변동이 더 커집니다.
F 값이 높을수록 해당 p 값은 낮아집니다.
p-값이 특정 임계값(예: α = 0.05)보다 낮으면 ANOVA의 귀무 가설을 기각하고 그룹 평균 간에 통계적으로 유의한 차이가 있다는 결론을 내릴 수 있습니다.

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기