회귀 분석의 전반적인 유의성에 대한 f-검정을 이해하기 위한 간단한 가이드


이 튜토리얼에서는 회귀표 출력에서 F 통계량을 식별하는 방법과 이 통계량 및 해당 p-값을 해석하는 방법을 설명합니다.

전반적인 유의성 F 검정 이해

회귀 분석의 전체 유의성에 대한 F-검정은 선형 회귀 모델이 예측 변수가 없는 모델보다 데이터 집합에 더 잘 맞는지 여부를 확인하기 위한 테스트입니다.

전체 유의성 F 테스트는 다음 두 가지 가정을 기반으로 합니다.

귀무 가설( H0 ): 예측 변수가 없는 모델( 절편 전용 모델 이라고도 함)은 회귀 모델뿐만 아니라 데이터에도 적합합니다.

대립 가설( HA ): 회귀 모델은 절편 전용 모델보다 데이터에 더 잘 맞습니다.

회귀 모델을 데이터 세트에 맞추면 F 통계에 해당하는 p-값과 함께 F 통계를 알려주는 회귀 테이블이 출력으로 제공됩니다.

p-값이 선택한 유의 수준( 일반적인 선택은 0.01, 0.05, 0.10 )보다 작은 경우 회귀 모델이 원래 모델로만 데이터에 적합하다는 결론을 내릴 수 있는 충분한 증거가 있는 것입니다. 모델.

예: 회귀 분석의 F 테스트

12명의 학생에 대한 총 학습 시간, 총 준비 시험 수, 최종 시험 성적을 보여주는 다음 데이터 세트가 있다고 가정합니다.

학생이 획득한 최종 시험 성적을 기준으로 학습 시간과 준비 시험 간의 관계를 분석하기 위해 학습 시간준비 시험을 예측 변수로 사용 하고 시험 중인 최종 성적을 반응 변수로 사용하여 다중 선형 회귀 분석을 수행했습니다.

우리는 다음과 같은 결과를 얻습니다:

이러한 결과에서 우리는 ANOVA 테이블에 제공된 F 통계량과 이 F 통계량의 p-값(테이블에서 F 유의성 으로 표시됨)에 중점을 둘 것입니다. 유의수준으로 0.05를 선택하겠습니다.

F-통계량: 5.090515

P-값: 0.0332

기술 참고 사항: F 통계는 MS 회귀를 MS 잔차로 나누어 계산됩니다. 이 경우 MS 회귀 / MS 잔차 = 273.2665 / 53.68151 = 5.090515 입니다.

p-값이 유의 수준보다 낮기 때문에 회귀 모델이 절편 전용 모델보다 데이터에 더 잘 맞는다는 결론을 내릴 수 있습니다.

이 특정 문제의 맥락에서 이는 모델에서 학습 시간준비 시험 예측 변수를 사용하면 이를 제외하고 단순히 절편 모델을 고유하게 사용한 경우보다 데이터를 더 잘 맞출 수 있음을 의미합니다.

전반적인 유의성에 대한 F-검정 해석에 대한 참고 사항

일반적으로 예측 변수 중 어느 것도 통계적으로 유의하지 않으면 전체 F-검정도 통계적으로 유의하지 않습니다.

그러나 일부 경우에는 그렇지 않을 수도 있습니다. 전체 유의성에 대한 F-검정은 모든 예측 변수가 공동으로 유의한지 여부를 테스트하는 반면, 각 개별 예측 변수에 대한 유의성에 대한 T-검정은 단순히 각 예측 변수가 유의한지 여부를 테스트하기 때문입니다. 개별적으로 중요합니다.

따라서 F 검정은 모든 예측 변수가 공동으로 유의한지 여부를 확인합니다.

각 예측 변수가 유의하지 않더라도 F 검정은 결합된 모든 예측 변수가 공동으로 유의하다는 것을 나타낼 수 있습니다.

기술 참고 사항: 일반적으로 모델에 예측 변수가 많을수록 F 통계 및 해당 p-값이 통계적으로 유의할 확률이 높아집니다.

회귀 결과에서 볼 수 있는 또 다른 측정항목은 예측 변수와 응답 변수 간의 선형 관계의 강도를 측정하는 R-제곱 입니다.

R-제곱은 예측 변수가 반응 변수와 어느 정도 강력하게 연관되어 있는지에 대한 아이디어를 제공할 수 있지만 이 관계에 대한 공식적인 통계 테스트를 제공하지는 않습니다.

이것이 F-검정이 공식적인 통계 검정이기 때문에 유용한 이유입니다. 또한 전체 F-검정이 유의하면 R-제곱이 0이 아니며 예측 변수와 반응 변수 간의 상관 관계가 통계적으로 유의하다는 결론을 내릴 수 있습니다.

추가 리소스

다음 튜토리얼에서는 회귀 모델에서 다른 공통 값을 해석하는 방법을 설명합니다.

회귀표를 읽고 해석하는 방법
회귀의 표준 오류 이해
좋은 R 제곱 값이란 무엇입니까?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다