Excel에서 부분 f 테스트를 수행하는 방법


부분 F-검정은 회귀 모델 과 동일한 모델의 중첩 버전 간에 통계적으로 유의미한 차이가 있는지 여부를 확인하는 데 사용됩니다.

중첩 모델은 단순히 전체 회귀 모델에서 예측 변수의 하위 집합을 포함하는 모델입니다.

예를 들어, 4개의 예측 변수가 있는 다음과 같은 회귀 모델이 있다고 가정합니다.

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

중첩 모델의 예는 원래 예측 변수가 2개만 있는 다음 모델입니다.

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

이 두 모델이 크게 다른지 확인하기 위해 다음 F-검정 통계량을 계산하는 부분 F-검정을 수행할 수 있습니다.

F = (( 감소된 RSS – 전체 RSS)/p) / ( 전체 RSS /nk)

금:

  • 축소된 RSS : 축소된(예: “중첩”) 모델의 잔차 제곱합입니다.
  • RSS 전체 : 전체 모델의 잔차 제곱합입니다.
  • p: 전체 모델에서 제거된 예측 변수의 수입니다.
  • n: 데이터 세트의 총 관측치 수입니다.
  • k: 전체 모델의 계수(절편 포함) 수입니다.

이 테스트에서는 다음과 같은 귀무가설과 대립 가설을 사용합니다.

H 0 : 전체 모델에서 제거된 모든 계수는 0입니다.

H A : 전체 모델에서 제거된 계수 중 적어도 하나는 0이 아닙니다.

F-검정 통계량에 해당하는 p-값이 특정 유의 수준(예: 0.05)보다 낮으면 귀무 가설을 기각하고 전체 모델에서 제거된 계수 중 하나 이상이 유의하다는 결론을 내릴 수 있습니다.

다음 예에서는 Excel에서 부분 F 테스트를 수행하는 방법을 보여줍니다.

예: Excel의 부분 F 테스트

Excel에 다음과 같은 데이터 세트가 있다고 가정합니다.

다음 두 회귀 모델 사이에 차이가 있는지 확인한다고 가정해 보겠습니다.

완전한 모델: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4

축소 모델: y = β 0 + β 1 x 1 + β 2 x 2

각 모델에 대해 Excel에서 다중 선형 회귀를 수행하여 다음 결과를 얻을 수 있습니다.

그런 다음 다음 공식을 사용하여 부분 F-검정에 대한 F-검정 통계량을 계산할 수 있습니다.

테스트 통계는 2.064 로 나타났습니다.

그런 다음 다음 공식을 사용하여 해당 p-값을 계산할 수 있습니다.

p-값은 0.1974 로 나타났습니다.

이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 이는 x3 또는 x4 예측 변수 중 하나가 통계적으로 유의하다고 말할 수 있는 증거가 충분하지 않음을 의미합니다.

즉, 회귀 모델에 x3x4를 추가해도 모델 적합도가 크게 향상되지 않습니다.

추가 리소스

Excel에서 단순 선형 회귀를 수행하는 방법
Excel에서 다중 선형 회귀를 수행하는 방법
Excel에서 회귀 표준 오류를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다