Comment calculer le R-carré dans SAS



R-carré , souvent écrit r 2 , est une mesure de l’adéquation d’un modèle de régression linéaire à un ensemble de données.

Cette valeur représente la proportion de la variance de la variable de réponse qui peut être expliquée par la variable prédictive.

La valeur de r 2 peut aller de 0 à 1 :

  • Une valeur de 0 indique que la variable de réponse ne peut pas du tout être expliquée par la variable prédictive.
  • Une valeur de 1 indique que la variable de réponse peut être parfaitement expliquée sans erreur par la variable prédictive.

Connexes : Qu’est-ce qu’une bonne valeur R au carré ?

L’exemple étape par étape suivant montre comment calculer la valeur R au carré pour un modèle de régression linéaire simple dans SAS.

Étape 1 : Créer les données

Pour cet exemple, nous allons créer un ensemble de données contenant le nombre total d’heures étudiées et la note de l’examen final de 15 étudiants.

Nous allons ajuster un modèle de régression linéaire simple en utilisant les heures comme variable prédictive et le score comme variable de réponse.

Le code suivant montre comment créer cet ensemble de données dans SAS :

/*create dataset*/
data exam_data;
    input hours score;
    datalines;
1 64
2 66
4 76
5 73
5 74
6 81
6 83
7 82
8 80
10 88
11 84
11 82
12 91
12 93
14 89
;
run;

/*view dataset*/
proc print data=exam_data;

Étape 2 : Ajuster le modèle de régression linéaire simple

Ensuite, nous utiliserons proc reg pour ajuster le modèle de régression linéaire simple :

/*fit simple linear regression model*/
proc reg data=exam_data;
    model score = hours;
run;

sortie de régression linéaire simple dans SAS

Notez que la valeur R au carré dans la sortie est de 0,8310.

Cela signifie que 83,1 % de la variation des résultats aux examens peut s’expliquer par le nombre d’heures étudiées.

Étape 3 : Extraire la valeur R au carré du modèle de régression

Si vous souhaitez uniquement afficher la valeur R au carré de ce modèle et aucun des autres résultats de sortie, vous pouvez utiliser le code suivant :

/*fit simple linear regression model*/
proc reg data=exam_data outest=outest noprint;
    model score = hours / rsquare;
run;
quit;

/*print R-squared value of model*/
proc print data=outest;
    var _RSQ_;
run;

Notez que seule la valeur R au carré de 0,83098 est affichée dans la sortie.

Remarque : L’argument noprint dans proc reg indique à SAS de ne pas imprimer l’intégralité de la sortie des résultats de régression comme il l’a fait à l’étape précédente.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans SAS :

Comment effectuer une régression linéaire simple dans SAS
Comment effectuer une régression linéaire multiple dans SAS
Comment effectuer une régression polynomiale dans SAS
Comment effectuer une régression logistique dans SAS

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *