보간 또는 외삽: 차이점은 무엇입니까?


통계학에서 학생들이 자주 혼동하는 두 가지 용어는 보간(interpolation)외삽(extrapolation) 입니다.

차이점은 다음과 같습니다.

보간이란 데이터 포인트의 범위에 속하는 값을 예측하는 것을 말합니다.

외삽이란 데이터 포인트 범위를 벗어나는 값을 예측하는 것을 말합니다.

다음 예에서는 두 용어의 차이점을 보여줍니다.

예: 보간 및 외삽

다음과 같은 데이터 세트가 있다고 가정합니다.

다음 지점에 간단한 선형 회귀 모델을 적용하기로 결정할 수 있습니다.

그런 다음 적합 회귀 모델을 사용하여 데이터 포인트 범위 내부외부의 포인트 값을 예측할 수 있습니다.

적합 회귀 모델을 사용하여 기존 데이터 포인트 범위 내의 포인트 값을 예측하는 것을 보간이라고 합니다.

반대로, 적합 회귀 모델을 사용하여 기존 범위 밖의 점 값을 예측하는 것을 외삽 이라고 합니다.

외삽의 잠재적 위험

추정할 때 현재 데이터 포인트 범위 내부에 존재하는 동일한 패턴이 범위 외부에도 존재한다고 가정합니다.

그러나 현재 데이터 포인트 범위 외부에 존재하는 패턴이 매우 다를 수 있으므로 이는 위험한 가정이 될 수 있습니다.

외삽의 위험성

이러한 이유로 회귀 모델을 생성하는 데 사용된 값 범위를 벗어나는 데이터 포인트 값을 예측하기 위해 외삽법을 사용하는 것은 위험할 수 있습니다.

실제로는 외삽법을 사용하여 기존 값의 범위를 약간 벗어나는 점 값을 예측하는 것이 타당한 경우가 많지만, 범위에서 멀어질수록 예측 값과 실제 값의 차이가 발생할 확률이 높아집니다. 가치가 중요합니다. .

외삽법을 사용해야 하는 경우

외삽이 합리적인 아이디어인지 여부를 결정하려면 분야별 전문 지식이 필요한 경우가 많습니다.

예를 들어, 회사의 마케팅 부서에서 광고 지출을 예측 변수로 사용하고 총 수익을 반응 변수로 사용하는 단순 선형 회귀 모델을 적용한다고 가정합니다.

이 시나리오에서는 광고 지출이 꾸준히 증가하면 예측 가능한 총 수익 증가가 발생할 것이라고 가정하는 것이 합리적일 수 있습니다.

이 시나리오에서 우리는 가치를 추정하는 능력에 대해 상당히 확신을 가질 수 있습니다.

그러나 생물학자가 식물 성장을 예측하기 위해 총 비료를 사용하려는 시나리오를 생각해 보십시오.

그녀는 간단한 선형 회귀 모델을 데이터 포인트에 맞추기로 결정할 수 있지만 식물 높이에는 상한이 있으므로 외삽을 사용하여 포인트 값을 예측하는 것은 아마도 의미가 없을 것입니다. 값 범위를 벗어났습니다. 모델을 맞추는 데 사용되는 값:

이 시나리오에서는 가치를 추정하는 능력에 대한 신뢰도가 훨씬 낮아질 수 있습니다.

요점 : 외삽법은 일부 영역에서는 다른 영역보다 더 의미가 있을 수 있지만, 모델을 맞추는 데 사용된 값 범위에 존재하는 모델이 해변 외부에 존재하지 않을 가능성이 항상 존재합니다.

추가 리소스

Excel에서 선형 보간을 수행하는 방법
선형 회귀를 사용하여 예측하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다