Sas에서 다항식 회귀를 수행하는 방법


가장 일반적인 유형의 회귀 분석은 단순 선형 회귀 로, 예측 변수와 반응 변수가 선형 관계를 가질 때 사용됩니다.

그러나 예측 변수와 반응 변수 간의 관계가 비선형인 경우도 있습니다.

이러한 경우 변수 간의 비선형 관계를 설명할 수 있는 다항식 회귀를 사용하는 것이 좋습니다.

다음 예에서는 SAS에서 다항식 회귀를 수행하는 방법을 보여줍니다.

예: SAS의 다항식 회귀

SAS에 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

 /*create dataset*/
data my_data;
    input xy;
    datalines ;
2 18
4 14
4 16
5 17
6 18
7 23
7 25
8 28
9 32
12 29
;
run ;

/*view dataset*/
proc print data =my_data;

이제 데이터세트의 변수 x와 y 사이의 관계를 시각화하기 위해 산점도를 생성한다고 가정합니다.

 /*create scatter plot of x vs. y*/
proc sgplot data =my_data;
    scatter x =x y =y;
run ; 

그래프에서 x와 y 사이의 관계가 3차 관계로 나타나는 것을 볼 수 있습니다.

따라서 데이터세트에 두 개의 새로운 예측 변수(x 2 및 x 3 )를 정의한 다음 proc reg를 사용하여 이러한 예측 변수를 사용하여 다항식 회귀 모델을 맞출 수 있습니다.

 /*create dataset with new predictor variables*/
data my_data;
    input xy;
    x2 = x** 2 ;
    x3 = x** 3 ;
    datalines ;
2 18
4 14
4 16
5 17
6 18
7 23
7 25
8 28
9 32
12 29
;
run ;

/*fit polynomial regression model*/
proc reg data =my_data;
    model y = x x2 x3;
run ;

매개변수 추정값 표에서 계수 추정값을 찾고 적합 다항식 회귀 방정식을 다음과 같이 작성할 수 있습니다.

y = 37.213 – 14.238x + 2.648x 2 – 0.126x 3

이 방정식은 주어진 예측변수 값에 대해 반응변수의 기대값을 찾는 데 사용될 수 있습니다.

예를 들어, xa의 값이 4라면 y의 값은 14.565여야 합니다.

y = 37.213 – 14.238(4) + 2.648(4) 2 – 0.126(4) 3 = 14.565

또한 다항식 회귀 모델의 조정된 R 제곱 값이 0.9636 이라는 것을 알 수 있는데, 이는 1에 매우 가깝고 모델이 데이터 세트를 훌륭하게 피팅하고 있음을 알려줍니다.

관련 항목: 조정된 R-제곱을 해석하는 방법(예 포함)

추가 리소스

다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

SAS에서 단순 선형 회귀를 수행하는 방법
SAS에서 다중 선형 회귀를 수행하는 방법
SAS에서 분위수 회귀를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다