Mae 대 rmse: 어떤 측정항목을 사용해야 합니까?


회귀 모델은 하나 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용됩니다.

회귀 모델을 적합시킬 때마다 모델이 예측 변수의 값을 얼마나 잘 사용하여 응답 변수의 값을 예측할 수 있는지 이해하고 싶습니다.

모델이 데이터 세트에 얼마나 잘 맞는지 수량화하기 위해 자주 사용하는 두 가지 지표는 평균 절대 오차(MAE)와 평균 제곱근 오차(RMSE)이며, 이는 다음과 같이 계산됩니다.

MAE : 데이터 세트의 예측 값과 실제 값 사이의 평균 절대 차이를 알려주는 메트릭입니다. MAE가 낮을수록 모델이 데이터 세트에 더 잘 맞는 것입니다.

MAE = 1/n * Σ|y i – ŷ i |

금:

  • Σ는 ‘합’을 의미하는 기호입니다.
  • y ii번째 관측치에 대한 관측값입니다.
  • ŷ i 는 i 번째 관측치에 대한 예측값입니다.
  • n은 표본 크기입니다.

RMSE : 데이터 세트의 예측 값과 실제 값 간의 차이의 제곱 평균 제곱근을 알려주는 지표입니다. RMSE가 낮을수록 모델이 데이터 세트에 더 잘 맞는 것입니다.

다음과 같이 계산됩니다.

RMSE = √ Σ(y i – ŷ i ) 2 / n

금:

  • Σ는 ‘합’을 의미하는 기호입니다.
  • ŷ i 는 i 번째 관측치에 대한 예측값입니다.
  • y ii번째 관측치에 대한 관측값입니다.
  • n은 표본 크기입니다.

예: RMSE 및 MAE 계산

농구 경기에서 10명의 선수가 득점할 점수를 예측하기 위해 회귀 모델을 사용한다고 가정해 보겠습니다.

다음 표는 플레이어가 획득한 실제 점수와 비교하여 모델에서 예측한 점수를 보여줍니다.

MAE 계산기를 사용하면 MAE가 3.2라는 것을 계산할 수 있습니다.

이는 모델이 예측한 값과 실제 값의 평균절대차가 3.2임을 알 수 있다.

RMSE 계산기를 사용하면 RMSE가 4 와 같다는 것을 계산할 수 있습니다.

이는 예측된 득점 포인트와 실제 득점 포인트 사이의 차이 제곱평균제곱근의 제곱근이 4라는 것을 알려줍니다.

각 지표는 모델에 의해 예측된 값과 데이터 세트의 실제 값 사이의 일반적인 차이에 대한 아이디어를 제공하지만 각 지표의 해석은 약간 다릅니다.

RMSE와 MAE: 어떤 지표를 사용해야 합니까?

평균에서 더 멀리 있는 관측치에 더 많은 가중치를 할당하려면(예: 편차 20이 편차 10보다 두 배 이상 나쁜 경우) RMSE를 사용하여 오류를 측정하는 것이 좋습니다. 평균에서 더 멀리 떨어진 관측치에 더 민감합니다.

그러나 20에서 “오프셋”되는 것이 10에서 “오프셋”되는 것보다 두 배나 나쁜 경우 MAE를 사용하는 것이 좋습니다.

이를 설명하기 위해 득점한 점수 측면에서 확실히 이상치인 플레이어가 있다고 가정해 보겠습니다.

앞서 언급한 온라인 계산기를 사용하여 MAE 및 RMSE를 다음과 같이 계산할 수 있습니다.

  • : 8
  • RMSE : 16.4356

RMSE는 MAE보다 훨씬 더 많이 증가합니다.

이는 RMSE가 수식에서 차이의 제곱을 사용하는데, 관측값 76과 예측값 22의 차이 제곱이 상당히 크기 때문입니다. 이로 인해 RMSE 값이 크게 증가합니다.

실제로 우리는 일반적으로 여러 회귀 모델을 데이터세트에 맞추고 각 모델에 대해 이러한 측정항목 중 하나만 계산합니다.

예를 들어 세 가지 다른 회귀 모델을 적용하고 각 모델의 RMSE를 계산할 수 있습니다. 그런 다음 RMSE 값이 가장 낮은 모델을 “최고” 모델로 선택합니다. 왜냐하면 이 모델이 데이터 세트의 실제 값에 가장 가까운 예측을 하기 때문입니다.

두 경우 모두 각 모델에 대해 동일한 측정항목을 계산해야 합니다. 예를 들어 한 모델의 MAE와 다른 모델의 RMSE를 계산한 다음 이 두 측정값을 비교하지 마십시오.

추가 리소스

다음 튜토리얼에서는 다양한 통계 소프트웨어를 사용하여 MAE를 계산하는 방법을 설명합니다.

Excel에서 평균 절대 오류를 계산하는 방법
R에서 평균 절대 오차를 계산하는 방법
Python에서 평균 절대 오류를 계산하는 방법

다음 튜토리얼에서는 다양한 통계 소프트웨어를 사용하여 RMSE를 계산하는 방법을 설명합니다.

Excel에서 평균 제곱 오류를 계산하는 방법
R에서 평균 제곱 오차를 계산하는 방법
Python에서 평균 제곱 오류를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다