Excel에서 부분 f 테스트를 수행하는 방법
부분 F-검정은 회귀 모델 과 동일한 모델의 중첩 버전 간에 통계적으로 유의미한 차이가 있는지 여부를 확인하는 데 사용됩니다.
중첩 모델은 단순히 전체 회귀 모델에서 예측 변수의 하위 집합을 포함하는 모델입니다.
예를 들어, 4개의 예측 변수가 있는 다음과 같은 회귀 모델이 있다고 가정합니다.
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
중첩 모델의 예는 원래 예측 변수가 2개만 있는 다음 모델입니다.
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
이 두 모델이 크게 다른지 확인하기 위해 다음 F-검정 통계량을 계산하는 부분 F-검정을 수행할 수 있습니다.
F = (( 감소된 RSS – 전체 RSS)/p) / ( 전체 RSS /nk)
금:
- 축소된 RSS : 축소된(예: “중첩”) 모델의 잔차 제곱합입니다.
- RSS 전체 : 전체 모델의 잔차 제곱합입니다.
- p: 전체 모델에서 제거된 예측 변수의 수입니다.
- n: 데이터 세트의 총 관측치 수입니다.
- k: 전체 모델의 계수(절편 포함) 수입니다.
이 테스트에서는 다음과 같은 귀무가설과 대립 가설을 사용합니다.
H 0 : 전체 모델에서 제거된 모든 계수는 0입니다.
H A : 전체 모델에서 제거된 계수 중 적어도 하나는 0이 아닙니다.
F-검정 통계량에 해당하는 p-값이 특정 유의 수준(예: 0.05)보다 낮으면 귀무 가설을 기각하고 전체 모델에서 제거된 계수 중 하나 이상이 유의하다는 결론을 내릴 수 있습니다.
다음 예에서는 Excel에서 부분 F 테스트를 수행하는 방법을 보여줍니다.
예: Excel의 부분 F 테스트
Excel에 다음과 같은 데이터 세트가 있다고 가정합니다.
다음 두 회귀 모델 사이에 차이가 있는지 확인한다고 가정해 보겠습니다.
완전한 모델: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4
축소 모델: y = β 0 + β 1 x 1 + β 2 x 2
각 모델에 대해 Excel에서 다중 선형 회귀를 수행하여 다음 결과를 얻을 수 있습니다.
그런 다음 다음 공식을 사용하여 부분 F-검정에 대한 F-검정 통계량을 계산할 수 있습니다.
테스트 통계는 2.064 로 나타났습니다.
그런 다음 다음 공식을 사용하여 해당 p-값을 계산할 수 있습니다.
p-값은 0.1974 로 나타났습니다.
이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 x3 또는 x4 예측 변수 중 하나가 통계적으로 유의하다고 말할 수 있는 증거가 충분하지 않음을 의미합니다.
즉, 회귀 모델에 x3 과 x4를 추가해도 모델 적합도가 크게 향상되지 않습니다.
추가 리소스
Excel에서 단순 선형 회귀를 수행하는 방법
Excel에서 다중 선형 회귀를 수행하는 방법
Excel에서 회귀 표준 오류를 계산하는 방법