Comment effectuer une régression quantile dans SAS



La régression linéaire est une méthode que nous pouvons utiliser pour comprendre la relation entre une ou plusieurs variables prédictives et une variable de réponse .

Généralement, lorsque nous effectuons une régression linéaire, nous souhaitons estimer la valeur moyenne de la variable de réponse.

Cependant, nous pourrions plutôt utiliser une méthode connue sous le nom de régression quantile pour estimer toute valeur centile de la valeur de réponse, telle que le 30e centile, le 90e centile, le 98e centile, etc.

Pour effectuer une régression quantile dans SAS, nous pouvons utiliser l’instruction proc quantreg .

L’exemple suivant montre comment effectuer une régression quantile dans SAS dans la pratique.

Exemple : exécution d’une régression quantile dans SAS

Supposons que nous ayons l’ensemble de données suivant dans SAS qui montre le nombre d’heures étudiées et la note d’examen correspondante pour les étudiants d’une classe :

/*create dataset*/
data original_data;
    input hours score;
    datalines;
1 75
1 79
2 78
2 83
2 85
3 84
3 84
3 89
4 93
4 88
4 79
4 94
5 96
5 98
;
run;

/*view dataset*/
proc print data=original_data;

Ensuite, nous ajusterons un modèle de régression quantile en utilisant les heures étudiées comme variable prédictive et les résultats à l’examen comme variable de réponse.

Nous utiliserons le modèle pour prédire le 90e centile attendu des résultats aux examens en fonction du nombre d’heures étudiées :

/*perform quantile regression*/
proc quantreg data=original_data;
    model score = hours / quantile = 0.9;
run;

régression quantile dans SAS

À partir du résultat, nous pouvons voir l’équation de régression estimée :

90e centile de la note de l’examen = 76 + 4,5 (heures)

Par exemple, le 90e percentile des scores de tous les étudiants qui étudient 2 heures devrait être de 85 :

90e centile de la note de l’examen = 76 + 4,5*(2) = 85 .

La sortie affiche également un nuage de points des données brutes avec la droite de régression ajustée superposée sur le tracé :

Contrairement à un modèle de régression classique, la droite ajustée de ce modèle de régression passe par le 90e percentile de chaque valeur de la variable prédictive au lieu de la valeur moyenne.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment effectuer une régression linéaire simple dans R
Comment effectuer une régression linéaire multiple dans R
Comment effectuer une régression quadratique dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *