Sas에서 r 제곱을 계산하는 방법


r2 라고도 불리는 R-제곱은 선형 회귀 모델이 데이터 세트에 얼마나 잘 맞는지를 나타내는 척도입니다.

이 값은 예측 변수로 설명할 수 있는 반응 변수 의 분산 비율을 나타냅니다.

r 2 값의 범위는 0에서 1까지입니다.

  • 0 값은 반응 변수가 예측 변수로 전혀 설명될 수 없음을 나타냅니다.
  • 값 1은 반응 변수가 예측 변수에 의해 오류 없이 완벽하게 설명될 수 있음을 나타냅니다.

관련 항목: 좋은 R 제곱 값이란 무엇입니까?

다음 단계별 예에서는 SAS에서 단순 선형 회귀 모델에 대한 R 제곱 값을 계산하는 방법을 보여줍니다.

1단계: 데이터 생성

이 예에서는 15명의 학생의 총 학습 시간과 최종 시험 성적이 포함된 데이터 세트를 생성합니다.

우리는 시간을 예측 변수로 사용하고 점수를 응답 변수로 사용하여 간단한 선형 회귀 모델을 적합화할 것입니다.

다음 코드는 SAS에서 이 데이터 세트를 생성하는 방법을 보여줍니다.

 /*create dataset*/
data exam_data;
    input hours score;
    datalines ;
1 64
2 66
4 76
5 73
5 74
6 81
6 83
7 82
8 80
10 88
11 84
11 82
12 91
12 93
14 89
;
run ;

/*view dataset*/
proc print data =exam_data;

2단계: 단순 선형 회귀 모델 피팅

다음으로, 단순 선형 회귀 모델을 맞추기 위해 proc reg를 사용할 것입니다:

 /*fit simple linear regression model*/
proc reg data =exam_data;
    model score = hours;
run ; 

SAS의 단순 선형 회귀 출력

출력의 R 제곱 값은 0.8310입니다.

이는 시험 점수 변동의 83.1% 가 공부 시간에 의해 설명될 수 있음을 의미합니다.

3단계: 회귀 모델에서 R 제곱 값 추출

이 모델의 R-제곱 값만 표시하고 다른 출력 결과는 표시하지 않으려면 다음 코드를 사용할 수 있습니다.

 /*fit simple linear regression model*/
proc reg data =exam_data outest =outest noprint ;
    model score = hours / rsquare ;
run ;
quit ;

/*print R-squared value of model*/
proc print data =outest;
    var _RSQ_;
run ; 

출력에는 R 제곱 값인 0.83098 만 표시됩니다.

참고 : proc regnoprint 인수는 SAS에게 이전 단계에서처럼 전체 회귀 결과 출력을 인쇄하지 않도록 지시합니다.

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 단순 선형 회귀를 수행하는 방법
SAS에서 다중 선형 회귀를 수행하는 방법
SAS에서 다항식 회귀를 수행하는 방법
SAS에서 로지스틱 회귀를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다