Comment créer un tracé résiduel dans SAS



Les tracés des résidus sont souvent utilisés pour évaluer si les résidus d’un modèle de régression sont normalement distribués et s’ils présentent ou non une hétéroscédasticité .

Vous pouvez utiliser la syntaxe de base suivante pour ajuster un modèle de régression et produire un tracé résiduel pour le modèle dans SAS :

symbol value = circle;

proc reg data=my_data;
    model y = x;
    plot residual. * predicted.;
run;

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Remarque : L’instruction symbol précise que nous souhaitons afficher les points du tracé résiduel sous forme de cercles. La forme par défaut est un signe plus.

Exemple : créer un tracé résiduel dans SAS

Supposons que nous ayons l’ensemble de données suivant dans SAS :

/*create dataset*/
data my_data;
    input x y;
    datalines;
8 41
12 42
12 39
13 37
14 35
16 39
17 45
22 46
24 39
26 49
29 55
30 57
;
run;

/*view dataset*/
proc print data=my_data;

Nous pouvons utiliser la syntaxe suivante pour adapter un modèle de régression linéaire simple à cet ensemble de données et créer un tracé des résidus pour visualiser les résidus par rapport aux valeurs prédites :

/*fit simple linear regression model and create residual plot*/
symbol value = circle;
proc reg data=my_data;
   model y = x;
   plot residual. * predicted.;
run;

Le tracé résiduel sera affiché au bas de la sortie :

Tracé résiduel SAS

L’axe des x affiche les valeurs prédites et l’axe des y affiche les résidus.

Étant donné que les résidus sont dispersés de manière aléatoire autour de la valeur zéro sans tendance claire de variance croissante ou décroissante, l’hypothèse d’ homoscédasticité des résidus est satisfaite.

En haut du graphique, nous pouvons également voir l’équation de régression ajustée :

y = 29,631 + 0,7553x

Et sur le côté droit du graphique, nous pouvons également voir les métriques suivantes pour le modèle de régression :

  • N : Nombre total d’observations (12)
  • Rsq : R-carré du modèle (0,6324)
  • AdjRsq : R-carré ajusté du modèle (0,5956)
  • RMSE : L’erreur quadratique moyenne du modèle (4,4417)

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment créer des histogrammes dans SAS
Comment créer des nuages de points dans SAS
Comment identifier les valeurs aberrantes dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *