Mse 대 rmse: 어떤 측정항목을 사용해야 합니까?


회귀 모델은 하나 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용됩니다.

회귀 모델을 적합시킬 때마다 모델이 예측 변수의 값을 얼마나 잘 사용하여 응답 변수의 값을 예측할 수 있는지 이해하고 싶습니다.

모델이 데이터 세트에 얼마나 잘 맞는지 수량화하기 위해 자주 사용하는 두 가지 지표는 평균 제곱 오차(MSE)와 평균 제곱근 오차(RMSE)이며, 이는 다음과 같이 계산됩니다.

MSE : 데이터 세트의 예측 값과 실제 값 간의 평균 제곱근 차이를 알려주는 측정항목입니다. MSE가 낮을수록 모델이 데이터 세트에 더 잘 맞는 것입니다.

MSE = Σ(ŷ i – y i ) 2 / n

금:

  • Σ는 ‘합’을 의미하는 기호입니다.
  • ŷ i 는 i 번째 관측치에 대한 예측값입니다.
  • y ii번째 관측치에 대한 관측값입니다.
  • n은 표본 크기입니다.

RMSE : 데이터 세트의 예측 값과 실제 값 간의 차이의 제곱 평균 제곱근을 알려주는 지표입니다. RMSE가 낮을수록 모델이 데이터 세트에 더 잘 맞는 것입니다.

다음과 같이 계산됩니다.

RMSE = √ Σ(ŷ i – y i ) 2 / n

금:

  • Σ는 ‘합’을 의미하는 기호입니다.
  • ŷ i 는 i 번째 관측치에 대한 예측값입니다.
  • y ii번째 관측치에 대한 관측값입니다.
  • n은 표본 크기입니다.

공식은 거의 동일합니다. 실제로 평균 제곱 오차는 평균 제곱 오차의 제곱근에 불과합니다.

RMSE 대 MSE: 어떤 지표를 사용해야 합니까?

모델이 데이터 세트에 얼마나 잘 맞는지 평가하기 위해 RMSE를 더 자주 사용합니다 . RMSE는 응답 변수와 동일한 단위로 측정되기 때문입니다.

반대로, MSE는 반응 변수의 제곱 단위로 측정됩니다.

이를 설명하기 위해 회귀 모델을 사용하여 10명의 선수가 농구 경기에서 득점할 점수를 예측한다고 가정해 보겠습니다.

다음 표는 플레이어가 획득한 실제 점수와 비교하여 모델에서 예측한 점수를 보여줍니다.

평균 제곱 오차(MSE)는 다음과 같이 계산됩니다.

  • MSE = Σ(ŷ i – y i ) 2 / n
  • MSE = ((14-12) 2 +(15-15) 2 +(18-20) 2 +(19-16) 2 +(25-20) 2 +(18-19) 2 +(12-16) 2 +(12-20) 2 +(15-16) 2 +(22-16) 2 ) / 10
  • MSE = 16

제곱평균제곱근 오차는 16 입니다. 이는 모델에서 예측한 값과 실제 값의 제곱평균제곱근 차이가 16임을 알려줍니다.

RMSE(평균 제곱근 오차)는 단순히 MSE의 제곱근입니다.

  • ADE = √ EQM
  • RMSE = √ 16
  • RMSE = 4

평균 제곱 오차는 4 입니다. 이는 예상 득점과 실제 득점 사이의 평균 편차가 4임을 나타냅니다.

평균 제곱 오류를 해석하는 것은 평균 제곱 오류보다 훨씬 간단합니다. 왜냐하면 “득점 제곱”이 아닌 “득점”에 대해 이야기하고 있기 때문입니다.

실제로 RMSE를 사용하는 방법

실제로 우리는 일반적으로 여러 회귀 모델을 데이터 세트에 맞추고 각 모델의 RMSE(평균 제곱근 오차)를 계산합니다.

그런 다음 RMSE 값이 가장 낮은 모델을 “최고” 모델로 선택합니다. 왜냐하면 이 모델이 데이터 세트의 실제 값에 가장 가까운 예측을 하기 때문입니다.

각 모델의 MSE 값을 비교할 수도 있지만 RMSE가 해석하기 더 간단하므로 더 자주 사용됩니다.

추가 리소스

다중 선형 회귀 소개
RMSE와 R-제곱: 어떤 측정항목을 사용해야 합니까?
RMSE 계산기

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다