중첩 모델이란 무엇입니까? (정의 & #038; 예)


중첩 모델은 단순히 다른 회귀 모델에 있는 예측 변수의 하위 집합을 포함하는 회귀 모델 입니다.

예를 들어, 4개의 예측 변수를 기반으로 농구 선수가 득점한 점수를 예측하는 다음 회귀 모델(모델 A라고 함)이 있다고 가정합니다.

포인트 = β 0 + β 1 (분) + β 2 (높이) + β 3 (위치) + β 4 (샷) + ε

중첩 모델(모델 B라고 함)의 예는 모델 A의 예측 변수가 2개만 있는 다음 모델입니다.

포인트 = β 0 + β 1 (분) + β 2 (높이) + ε

모델 B에는 모델 A의 예측 변수 하위 집합이 포함되어 있으므로 모델 B가 모델 A 내에 중첩되어 있다고 말할 수 있습니다.

그러나 세 가지 예측 변수를 포함하는 다른 모델(모델 C라고 함)이 있다고 가정해 보겠습니다.

점수 = β 0 + β 1 (분) + β 2 (키) + β 3 (자유투 시도)

각 모델에는 다른 모델에 포함되지 않은 예측 변수가 포함되어 있으므로 모델 C가 모델 A 내에 중첩되어 있다고 말할 수 없습니다 .

중첩 모델의 중요성

전체 예측 변수 집합이 포함된 모델이 해당 예측 변수의 하위 집합이 포함된 모델보다 데이터 집합에 더 잘 맞는지 여부를 알고 싶을 때 실제로 중첩 모델을 사용하는 경우가 많습니다.

예를 들어, 위 시나리오에서는 농구 선수가 득점한 점수를 예측하기 위해 경기 시간, 키, 위치 및 시도한 슛을 사용하여 포괄적인 모델을 적용할 수 있습니다.

그러나 우리는 위치와 시도된 슛이 점수를 잘 예측하지 못할 수도 있다고 의심할 수 있습니다.

따라서 우리는 플레이 시간과 투구만을 사용하여 득점 점수를 예측 하는 중첩 모델을 적합할 수 있습니다.

그런 다음 두 모델을 비교하여 통계적으로 유의미한 차이가 있는지 확인할 수 있습니다.

모델 간에 큰 차이가 없으면 예측 변수로 시도된 위치와 샷이 모델을 크게 개선하지 않으므로 제거할 수 있습니다.

중첩 모델을 구문 분석하는 방법

중첩 모델이 “전체” 모델과 크게 다른지 확인하기 위해 일반적으로 다음과 같은 귀무 가설과 대립 가설을 사용하는 우도 비율 테스트를 수행합니다.

H 0 : 전체 모델과 중첩 모델이 데이터를 동일하게 잘 적합합니다. 따라서 중첩 모델을 사용해야 합니다.

H A : 전체 모델이 중첩 모델보다 데이터에 훨씬 더 잘 맞습니다. 따라서 전체 템플릿을 사용해야 합니다.

우도비 검정은 카이제곱 검정 통계량과 해당 p-값을 생성합니다.

테스트의 p-값이 특정 유의 수준(예: 0.05)보다 낮으면 귀무 가설을 기각하고 전체 모델이 훨씬 더 나은 적합성을 제공한다는 결론을 내릴 수 있습니다.

다음 튜토리얼에서는 R 및 Python을 사용하여 우도 비율 테스트를 수행하는 방법을 설명합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다