Comment effectuer une régression polynomiale dans SAS



Le type d’analyse de régression le plus courant est la régression linéaire simple , utilisée lorsqu’une variable prédictive et une variable de réponse ont une relation linéaire.

Cependant, il arrive parfois que la relation entre une variable prédictive et une variable de réponse soit non linéaire.

Dans ces cas, il est logique d’utiliser la régression polynomiale , qui peut rendre compte de la relation non linéaire entre les variables.

L’exemple suivant montre comment effectuer une régression polynomiale dans SAS.

Exemple : régression polynomiale dans SAS

Supposons que nous ayons l’ensemble de données suivant dans SAS :

/*create dataset*/
data my_data;
    input x y;
    datalines;
2 18
4 14
4 16
5 17
6 18
7 23
7 25
8 28
9 32
12 29
;
run;

/*view dataset*/
proc print data=my_data;

Supposons maintenant que nous créions un nuage de points pour visualiser la relation entre les variables x et y dans l’ensemble de données :

/*create scatter plot of x vs. y*/
proc sgplot data=my_data;
    scatter x=x y=y;
run;

D’après le graphique, nous pouvons voir que la relation entre x et y semble être cubique.

Ainsi, nous pouvons définir deux nouvelles variables prédictives dans notre ensemble de données (x 2 et x 3 ), puis utiliser proc reg pour ajuster un modèle de régression polynomiale à l’aide de ces variables prédictives :

/*create dataset with new predictor variables*/
data my_data;
    input x y;
    x2 = x**2;
    x3 = x**3;
    datalines;
2 18
4 14
4 16
5 17
6 18
7 23
7 25
8 28
9 32
12 29
;
run;

/*fit polynomial regression model*/
proc reg data=my_data;
    model y = x x2 x3;
run;

À partir du tableau Estimations des paramètres , nous pouvons trouver les estimations des coefficients et écrire notre équation de régression polynomiale ajustée comme :

y = 37,213 – 14,238x + 2,648x 2 – 0,126x 3

Cette équation peut être utilisée pour trouver la valeur attendue de la variable de réponse en fonction d’une valeur donnée de la variable prédictive.

Par exemple, si x a une valeur de 4, alors y devrait avoir une valeur de 14,565 :

y = 37,213 – 14,238(4) + 2,648(4) 2 – 0,126(4) 3 = 14,565

Nous pouvons également voir que le modèle de régression polynomiale a une valeur R au carré ajustée de 0,9636 , ce qui est extrêmement proche de un et nous indique que le modèle fait un excellent travail d’ajustement de l’ensemble de données.

Connexes : Comment interpréter le R-carré ajusté (avec des exemples)

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment effectuer une régression linéaire simple dans SAS
Comment effectuer une régression linéaire multiple dans SAS
Comment effectuer une régression quantile dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *