회귀 분석의 전반적인 유의성에 대한 f-검정을 이해하기 위한 간단한 가이드
이 튜토리얼에서는 회귀표 출력에서 F 통계량을 식별하는 방법과 이 통계량 및 해당 p-값을 해석하는 방법을 설명합니다.
전반적인 유의성 F 검정 이해
회귀 분석의 전체 유의성에 대한 F-검정은 선형 회귀 모델이 예측 변수가 없는 모델보다 데이터 집합에 더 잘 맞는지 여부를 확인하기 위한 테스트입니다.
전체 유의성 F 테스트는 다음 두 가지 가정을 기반으로 합니다.
귀무 가설( H0 ): 예측 변수가 없는 모델( 절편 전용 모델 이라고도 함)은 회귀 모델뿐만 아니라 데이터에도 적합합니다.
대립 가설( HA ): 회귀 모델은 절편 전용 모델보다 데이터에 더 잘 맞습니다.
회귀 모델을 데이터 세트에 맞추면 F 통계에 해당하는 p-값과 함께 F 통계를 알려주는 회귀 테이블이 출력으로 제공됩니다.
p-값이 선택한 유의 수준( 일반적인 선택은 0.01, 0.05, 0.10 )보다 작은 경우 회귀 모델이 원래 모델로만 데이터에 적합하다는 결론을 내릴 수 있는 충분한 증거가 있는 것입니다. 모델.
예: 회귀 분석의 F 테스트
12명의 학생에 대한 총 학습 시간, 총 준비 시험 수, 최종 시험 성적을 보여주는 다음 데이터 세트가 있다고 가정합니다.
학생이 획득한 최종 시험 성적을 기준으로 학습 시간과 준비 시험 간의 관계를 분석하기 위해 학습 시간 과 준비 시험을 예측 변수로 사용 하고 시험 중인 최종 성적을 반응 변수로 사용하여 다중 선형 회귀 분석을 수행했습니다.
우리는 다음과 같은 결과를 얻습니다:
이러한 결과에서 우리는 ANOVA 테이블에 제공된 F 통계량과 이 F 통계량의 p-값(테이블에서 F 유의성 으로 표시됨)에 중점을 둘 것입니다. 유의수준으로 0.05를 선택하겠습니다.
F-통계량: 5.090515
P-값: 0.0332
기술 참고 사항: F 통계는 MS 회귀를 MS 잔차로 나누어 계산됩니다. 이 경우 MS 회귀 / MS 잔차 = 273.2665 / 53.68151 = 5.090515 입니다.
p-값이 유의 수준보다 낮기 때문에 회귀 모델이 절편 전용 모델보다 데이터에 더 잘 맞는다는 결론을 내릴 수 있습니다.
이 특정 문제의 맥락에서 이는 모델에서 학습 시간 및 준비 시험 예측 변수를 사용하면 이를 제외하고 단순히 절편 모델을 고유하게 사용한 경우보다 데이터를 더 잘 맞출 수 있음을 의미합니다.
전반적인 유의성에 대한 F-검정 해석에 대한 참고 사항
일반적으로 예측 변수 중 어느 것도 통계적으로 유의하지 않으면 전체 F-검정도 통계적으로 유의하지 않습니다.
그러나 일부 경우에는 그렇지 않을 수도 있습니다. 전체 유의성에 대한 F-검정은 모든 예측 변수가 공동으로 유의한지 여부를 테스트하는 반면, 각 개별 예측 변수에 대한 유의성에 대한 T-검정은 단순히 각 예측 변수가 유의한지 여부를 테스트하기 때문입니다. 개별적으로 중요합니다.
따라서 F 검정은 모든 예측 변수가 공동으로 유의한지 여부를 확인합니다.
각 예측 변수가 유의하지 않더라도 F 검정은 결합된 모든 예측 변수가 공동으로 유의하다는 것을 나타낼 수 있습니다.
기술 참고 사항: 일반적으로 모델에 예측 변수가 많을수록 F 통계 및 해당 p-값이 통계적으로 유의할 확률이 높아집니다.
회귀 결과에서 볼 수 있는 또 다른 측정항목은 예측 변수와 응답 변수 간의 선형 관계의 강도를 측정하는 R-제곱 입니다.
R-제곱은 예측 변수가 반응 변수와 어느 정도 강력하게 연관되어 있는지에 대한 아이디어를 제공할 수 있지만 이 관계에 대한 공식적인 통계 테스트를 제공하지는 않습니다.
이것이 F-검정이 공식적인 통계 검정이기 때문에 유용한 이유입니다. 또한 전체 F-검정이 유의하면 R-제곱이 0이 아니며 예측 변수와 반응 변수 간의 상관 관계가 통계적으로 유의하다는 결론을 내릴 수 있습니다.
추가 리소스
다음 튜토리얼에서는 회귀 모델에서 다른 공통 값을 해석하는 방법을 설명합니다.