Jak wykonać regresję wielomianową w sas-ie
Najpopularniejszym rodzajem analizy regresji jest prosta regresja liniowa , stosowana, gdy zmienna predykcyjna izmienna odpowiedzi mają liniową zależność.
Czasami jednak związek między zmienną predykcyjną a zmienną odpowiedzi jest nieliniowy.
W takich przypadkach sensowne jest zastosowanie regresji wielomianowej , która może wyjaśnić nieliniową zależność między zmiennymi.
Poniższy przykład pokazuje, jak przeprowadzić regresję wielomianową w SAS-ie.
Przykład: regresja wielomianowa w SAS-ie
Załóżmy, że mamy następujący zestaw danych w SAS-ie:
/*create dataset*/ data my_data; input xy; datalines ; 2 18 4 14 4 16 5 17 6 18 7 23 7 25 8 28 9 32 12 29 ; run ; /*view dataset*/ proc print data =my_data;
Załóżmy teraz, że tworzymy wykres rozrzutu, aby zwizualizować relację między zmiennymi x i y w zbiorze danych:
/*create scatter plot of x vs. y*/
proc sgplot data =my_data;
scatter x =x y =y;
run ;
Z wykresu widzimy, że związek między x i y wydaje się być sześcienny.
Możemy zatem zdefiniować w naszym zbiorze danych dwie nowe zmienne predykcyjne (x 2 i x 3 ), a następnie użyć proc reg w celu dopasowania modelu regresji wielomianowej przy użyciu następujących zmiennych predykcyjnych:
/*create dataset with new predictor variables*/ data my_data; input xy; x2 = x** 2 ; x3 = x** 3 ; datalines ; 2 18 4 14 4 16 5 17 6 18 7 23 7 25 8 28 9 32 12 29 ; run ; /*fit polynomial regression model*/ proc reg data =my_data; model y = x x2 x3; run ;
W tabeli Oszacowania parametrów możemy znaleźć oszacowania współczynników i zapisać nasze dopasowane równanie regresji wielomianowej jako:
y = 37,213 – 14,238x + 2,648x 2 – 0,126x 3
Równanie to można wykorzystać do znalezienia oczekiwanej wartości zmiennej odpowiedzi przy danej wartości zmiennej predykcyjnej.
Na przykład, jeśli xa ma wartość 4, to y powinno mieć wartość 14,565:
y = 37,213 – 14,238(4) + 2,648(4) 2 – 0,126(4) 3 = 14,565
Widzimy również, że model regresji wielomianowej ma skorygowaną wartość R-kwadrat wynoszącą 0,9636 , która jest bardzo bliska jedności i mówi nam, że model doskonale radzi sobie z dopasowywaniem zbioru danych.
Powiązane: Jak interpretować skorygowany współczynnik R-kwadrat (z przykładami)
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak wykonać prostą regresję liniową w SAS-ie
Jak wykonać wielokrotną regresję liniową w SAS-ie
Jak wykonać regresję kwantylową w SAS