Jak wykonać regresję wielomianową w sas-ie


Najpopularniejszym rodzajem analizy regresji jest prosta regresja liniowa , stosowana, gdy zmienna predykcyjna izmienna odpowiedzi mają liniową zależność.

Czasami jednak związek między zmienną predykcyjną a zmienną odpowiedzi jest nieliniowy.

W takich przypadkach sensowne jest zastosowanie regresji wielomianowej , która może wyjaśnić nieliniową zależność między zmiennymi.

Poniższy przykład pokazuje, jak przeprowadzić regresję wielomianową w SAS-ie.

Przykład: regresja wielomianowa w SAS-ie

Załóżmy, że mamy następujący zestaw danych w SAS-ie:

 /*create dataset*/
data my_data;
    input xy;
    datalines ;
2 18
4 14
4 16
5 17
6 18
7 23
7 25
8 28
9 32
12 29
;
run ;

/*view dataset*/
proc print data =my_data;

Załóżmy teraz, że tworzymy wykres rozrzutu, aby zwizualizować relację między zmiennymi x i y w zbiorze danych:

 /*create scatter plot of x vs. y*/
proc sgplot data =my_data;
    scatter x =x y =y;
run ; 

Z wykresu widzimy, że związek między x i y wydaje się być sześcienny.

Możemy zatem zdefiniować w naszym zbiorze danych dwie nowe zmienne predykcyjne (x 2 i x 3 ), a następnie użyć proc reg w celu dopasowania modelu regresji wielomianowej przy użyciu następujących zmiennych predykcyjnych:

 /*create dataset with new predictor variables*/
data my_data;
    input xy;
    x2 = x** 2 ;
    x3 = x** 3 ;
    datalines ;
2 18
4 14
4 16
5 17
6 18
7 23
7 25
8 28
9 32
12 29
;
run ;

/*fit polynomial regression model*/
proc reg data =my_data;
    model y = x x2 x3;
run ;

W tabeli Oszacowania parametrów możemy znaleźć oszacowania współczynników i zapisać nasze dopasowane równanie regresji wielomianowej jako:

y = 37,213 – 14,238x + 2,648x 2 – 0,126x 3

Równanie to można wykorzystać do znalezienia oczekiwanej wartości zmiennej odpowiedzi przy danej wartości zmiennej predykcyjnej.

Na przykład, jeśli xa ma wartość 4, to y powinno mieć wartość 14,565:

y = 37,213 – 14,238(4) + 2,648(4) 2 – 0,126(4) 3 = 14,565

Widzimy również, że model regresji wielomianowej ma skorygowaną wartość R-kwadrat wynoszącą 0,9636 , która jest bardzo bliska jedności i mówi nam, że model doskonale radzi sobie z dopasowywaniem zbioru danych.

Powiązane: Jak interpretować skorygowany współczynnik R-kwadrat (z przykładami)

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak wykonać prostą regresję liniową w SAS-ie
Jak wykonać wielokrotną regresję liniową w SAS-ie
Jak wykonać regresję kwantylową w SAS

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *