통계에서 y hat은 무엇입니까?


통계에서 y hat ( ŷ 로 표기)이라는 용어는 선형 회귀 모델 의 반응 변수에 대한 추정 값을 나타냅니다.

일반적으로 추정 회귀 방정식은 다음과 같이 작성됩니다.

ŷ = β 0 + β 1 x

금:

  • ŷ : 반응변수의 추정값
  • β 0 : 예측변수가 0일 때 반응변수의 평균값
  • β 1 : 예측 변수의 한 단위 증가와 관련된 반응 변수의 평균 변화

예를 들어, 6명의 학생이 공부한 시간과 최종 시험 점수를 보여주는 다음 데이터 세트가 있다고 가정합니다.

연구한 시간을 예측 변수로 사용하여 다음 회귀 모델을 맞추기 위해 통계 소프트웨어(예: R , Excel , Python 또는 수동)를 사용하고 결과를 응답 변수로 검사한다고 가정합니다.

점수 = 66.615 + 5.0769*(시간)

이 모델의 회귀계수를 해석하는 방법은 다음과 같습니다.

  • 0시간 공부하는 학생의 평균 시험 점수는 66,615점 입니다.
  • 시험 점수는 공부한 시간이 추가될 때마다 평균 5.0769 점씩 증가합니다.

우리는 이 회귀 방정식을 사용하여 공부한 시간을 기준으로 특정 학생의 점수를 추정 할 수 있습니다.

예를 들어, 3시간 동안 공부한 학생은 다음 점수를 받아야 합니다.

점수 = 66.615 + 5.0769*(3) = 81.85

Y Hat은 왜 사용되나요?

통계에서 “모자” 기호는 “추정” 용어를 나타내는 데 사용됩니다. 예를 들어, ŷ는 추정된 반응 변수를 나타내는 데 사용됩니다.

일반적으로 선형 회귀 모델을 적용할 때 모집단의 데이터 샘플을 사용합니다. 이는 모집단에서 가능한 모든 관찰에 대한 데이터를 수집하는 것보다 더 편리하고 시간 소모가 적기 때문입니다.

따라서 회귀 방정식을 찾을 때 예측 변수와 응답 변수 간의 실제 관계만 추정합니다 .

이것이 회귀 방정식에서 y 대신 ŷ라는 용어를 사용하는 이유입니다.

추가 리소스

단순 선형 회귀 소개
다중 선형 회귀 소개
설명변수와 반응변수 소개

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다