Sas에서 rmse를 계산하는 방법


회귀 모델이 데이터 세트에 얼마나 잘 맞는지 평가하는 한 가지 방법은 평균 제곱 오차를 계산하는 것입니다. 이는 모델의 예측 값과 데이터 세트의 실제 값 사이의 평균 거리를 알려주는 지표입니다.

RMSE가 낮을수록 특정 모델이 데이터 세트에 더 잘 “적합”될 수 있습니다.

종종 RMSE로 약칭되는 평균 제곱 오차를 찾는 공식은 다음과 같습니다.

RMSE =Σ(P i – O i ) 2 / n

금:

  • Σ는 ‘합’을 나타내는 기호입니다.
  • Pi는 데이터 세트의 i번째 관측치에 대한 예측 값입니다.
  • O i 는 데이터세트의 i번째 관측치에 대한 관측값입니다.
  • n은 표본 크기입니다.

다음 단계별 예에서는 SAS에서 단순 선형 회귀 모델에 대한 RMSE를 계산하는 방법을 보여줍니다.

1단계: 데이터 생성

이 예에서는 15명의 학생의 총 학습 시간과 최종 시험 성적이 포함된 데이터 세트를 생성합니다.

우리는 시간을 예측 변수로 사용하고 점수를 응답 변수로 사용하여 간단한 선형 회귀 모델을 적합화할 것입니다.

다음 코드는 SAS에서 이 데이터 세트를 생성하는 방법을 보여줍니다.

 /*create dataset*/
data exam_data;
    input hours score;
    datalines ;
1 64
2 66
4 76
5 73
5 74
6 81
6 83
7 82
8 80
10 88
11 84
11 82
12 91
12 93
14 89
;
run ;

/*view dataset*/
proc print data =exam_data;

2단계: 단순 선형 회귀 모델 피팅

다음으로, 단순 선형 회귀 모델을 맞추기 위해 proc reg를 사용할 것입니다:

 /*fit simple linear regression model*/
proc reg data =exam_data;
    model score = hours;
run ; 

SAS의 단순 선형 회귀 출력

출력의 RMSE는 3.64093 입니다.

3단계: 회귀 모델에서 RMSE 추출

이 모델의 RMSE만 표시하고 다른 출력 결과는 표시하지 않으려면 다음 코드를 사용할 수 있습니다.

 /*fit simple linear regression model*/
proc reg data =exam_data outest =outest noprint ;
    model score = hours / rmse ;
run ;
quit ;

/*print RMSE of model*/
proc print data =outest;
    var _RMSE_;
run ; 

SAS에서 RMSE 계산

출력에는 RMSE 값 3.64093 만 표시됩니다.

참고 : proc regnoprint 인수는 SAS에게 이전 단계에서처럼 전체 회귀 결과 출력을 인쇄하지 않도록 지시합니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 단순 선형 회귀를 수행하는 방법
SAS에서 다중 선형 회귀를 수행하는 방법
SAS에서 다항식 회귀를 수행하는 방법
SAS에서 로지스틱 회귀를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다