선형 회귀를 사용하여 예측하는 방법


선형 회귀 는 하나 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용할 수 있는 방법입니다.

회귀 모델을 피팅하는 가장 일반적인 이유 중 하나는 모델을 사용하여 새로운 관찰 값을 예측하는 것입니다.

회귀 모델을 사용하여 예측하려면 다음 단계를 사용합니다.

  • 1단계: 데이터를 수집합니다.
  • 2단계: 회귀 모델을 데이터에 맞춥니다.
  • 3단계: 모델이 데이터에 적합한지 확인합니다.
  • 4단계: 적합 회귀 방정식을 사용하여 새 관측치의 값을 예측합니다.

다음 예에서는 회귀 모델을 사용하여 예측하는 방법을 보여줍니다.

예시 1: 단순 선형 회귀 모델을 사용한 예측

의사가 50명의 환자의 키(인치)와 체중(파운드)에 대한 데이터를 수집한다고 가정합니다.

그런 다음 “체중”을 예측 변수로 사용하고 “키”를 응답 변수로 사용하여 간단한 선형 회귀 모델을 적합합니다.

적합 회귀 방정식은 다음과 같습니다.

크기 = 32.7830 + 0.2001*(무게)

선형 회귀 모델의 가정이 충족되는지 확인한 후 의사는 모델이 데이터에 잘 맞는다는 결론을 내립니다.

그런 다음 모델을 사용하여 체중을 기준으로 새로운 환자의 키를 예측할 수 있습니다.

예를 들어, 새로운 환자의 체중이 170파운드라고 가정해 보겠습니다. 모델을 사용하여 이 환자의 키가 66.8인치일 것이라고 예측합니다.

높이 = 32.7830 + 0.2001*(170) = 66.8인치

예시 2: 다중 선형 회귀 모델을 사용한 예측

한 경제학자가 30명의 총 교육 기간, 주당 근무 시간, 연간 소득에 대한 데이터를 수집한다고 가정합니다.

그런 다음 “총 교육 기간”과 “주당 근무 시간”을 예측 변수로 사용하고 “연간 소득”을 응답 변수로 사용하여 다중 선형 회귀 모델을 적합합니다.

적합 회귀 방정식은 다음과 같습니다.

소득 = 1,342.29 + 3,324.33*(교육 기간) + 765.88*(주당 근무 시간)

선형 회귀 모델의 가정이 충족되는지 확인한 후 경제학자는 모델이 데이터에 잘 맞는다는 결론을 내립니다.

그런 다음 이 모델을 사용하여 총 교육 기간과 주당 근무 시간을 기준으로 새로운 개인의 연간 소득을 예측할 수 있습니다.

예를 들어, 새로운 개인이 총 16년의 교육을 받고 주당 평균 40시간을 일한다고 가정합니다. 모델을 사용하여 이 사람의 연간 소득은 $85,166.77일 것으로 예측합니다.

소득 = 1,342.29 + 3,324.33*(16) + 765.88*(45) = $85,166.77

신뢰구간 사용에 대하여

회귀 모델을 사용하여 새로운 관측값에 대해 예측할 때 회귀 모델에서 예측한 값을 점 추정치 라고 합니다.

점 추정치는 새 관측치 값에 대한 최선의 추정치를 나타내지만 새 관측치 값과 정확히 일치할 가능성은 없습니다.

따라서 이러한 불확실성을 포착하기 위해 특정 수준의 신뢰도를 갖는 모집단 매개변수를 포함할 가능성이 있는 값의 범위인 신뢰 구간을 만들 수 있습니다.

예를 들어, 새로운 개인의 키가 66.8인치일 것이라고 예측하는 대신 다음과 같은 신뢰 구간을 만들 수 있습니다.

95% 신뢰 구간 = [64.8인치, 68.8인치]

우리는 이 간격을 이 개인의 실제 키가 64.8인치에서 68.8인치 사이라고 95% 확신한다는 의미로 해석합니다.

예측할 때 주의할 점

회귀 모델을 사용하여 예측할 때 다음 사항에 유의하세요.

1. 회귀모델 추정에 사용된 데이터 범위 내에서 예측을 수행할 목적으로만 모델을 사용하십시오.

예를 들어, 예측 변수 “체중”을 사용하여 회귀 모델을 피팅하고 모델을 추정하는 데 사용한 표본의 개인 체중이 120~180파운드 사이였다고 가정해 보겠습니다.

체중이 200파운드인 개인의 키를 추정하기 위해 모델을 사용하는 것은 유효하지 않습니다. 이는 모델을 추정하는 데 사용한 예측 변수의 범위를 벗어나기 때문입니다.

120~180파운드 범위를 벗어나면 체중과 키의 관계가 다를 수 있습니다. 그러므로 우리는 이 모델을 사용하여 체중이 200파운드인 개인의 키를 추정해서는 안 됩니다.

2. 표본을 추출한 모집단에 대한 예측을 위해서만 모델을 사용하십시오.

예를 들어, 경제학자가 특정 도시에 살고 있는 모든 사람의 표본에서 인구를 추출한다고 가정해 보겠습니다.

모델을 적합시키는 데 사용된 전체 표본이 이 도시에 살았으므로 이 도시에 있는 개인의 연간 소득을 예측하려면 적합 회귀 모델만 사용해야 합니다.

추가 리소스

단순 선형 회귀 소개
다중 선형 회귀 소개
신뢰 구간 소개
선형 회귀의 네 가지 가정

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다