Comment effectuer une régression quantile dans Stata
La régression linéaire est une méthode que nous pouvons utiliser pour comprendre la relation entre une ou plusieurs variables explicatives et une variable de réponse.
Généralement, lorsque nous effectuons une régression linéaire, nous souhaitons estimer la valeur moyenne de la variable de réponse en fonction de la valeur de la variable explicative. Mais nous pourrions plutôt estimer la médiane, ou le percentile de 0,25, ou le percentile de 0,90, ou tout autre percentile que nous souhaitons.
C’est là qu’intervient la régression quantile . Semblable à la régression linéaire ordinaire, la régression quantile crée une équation de régression qui prédit une certaine valeur (par exemple la médiane, 0,25 percentile, 0,90 percentile, etc.) pour une variable de réponse basée sur la valeur de la variable explicative.
Ce tutoriel explique comment effectuer une régression quantile dans Stata.
Exemple : régression quantile dans Stata
Pour cet exemple, nous utiliserons l’ensemble de données Stata intégré appelé auto . Nous allons d’abord ajuster un modèle de régression linéaire en utilisant le poids comme variable prédictive et le mpg comme variable de réponse. Cela nous indiquera le mpg moyen attendu d’une voiture, en fonction de son poids. Ensuite, nous ajusterons un modèle de régression quantile pour prédire le 0,90 percentile de mpg d’une voiture, en fonction de son poids.
Étape 1 : Chargez et affichez les données.
Utilisez la commande suivante pour charger les données :
utilisation automatique du système
Utilisez la commande suivante pour obtenir un résumé des variables mpg etweight :
résumer le poids mpg
Étape 2 : Effectuez une régression linéaire simple.
Utilisez la commande suivante pour effectuer une régression linéaire simple, en utilisant le poids comme variable explicative et mpg comme variable de réponse :
régresser le poids en mpg
À partir du tableau de sortie, nous pouvons voir que l’équation de régression estimée est :
mpg prédit = 39,44028 – 0,0060087*(poids)
Nous pouvons utiliser cette équation pour trouver le mpg moyen estimé pour une voiture, compte tenu de son poids. Par exemple, on estime qu’une voiture qui pèse 4 000 livres a un mpg de 15,405 :
mpg prédit = 39,44028 – 0,0060087*(4000) = 15,405
Étape 3 : Effectuez une régression quantile.
Ensuite, effectuons une régression quantile pour obtenir le 90 e percentile estimé de la consommation d’une voiture, en fonction de son poids.
Utilisez la commande qreg avec quantile(0.90) pour effectuer cette régression quantile :
poids qreg mpg, quantile (0,90)
À partir du tableau de sortie, nous pouvons voir que l’équation de régression estimée est :
90 e percentile prévu de mpg = 47,02632 – 0,0072368*(poids)
Nous pouvons utiliser cette équation pour trouver l’estimation mpg pour une voiture dans le 90 e percentile, compte tenu de son poids. Par exemple, le 90e centile de mpg pour une voiture pesant 4 000 livres est estimé à 18,709 :
90 e percentile prévu de mpg = 47,02632 – 0,0072368*(4 000) = 18,079
Rappelons que notre précédent modèle de régression linéaire nous indiquait qu’une voiture pesant 4 000 livres avait une consommation moyenne estimée de 15,405 mpg. Il est donc logique que ce modèle de régression quantile nous dise qu’une voiture pesant 4 000 livres aurait besoin d’une consommation de 18,079 mpg pour se situer dans le 90 e percentile de toutes les voitures ayant ce poids particulier.
Plusieurs régressions quantiles à la fois dans Stata
Il est également possible d’effectuer plusieurs régressions quantiles à la fois dans Stata. Par exemple, supposons que nous souhaitions estimer simultanément le 25 e percentile, la médiane (par exemple, le 50 e percentile) et le 90 e percentile.
Pour ce faire, nous pouvons utiliser la commande sqreg avec la commande q() pour spécifier les quantiles à estimer :
poids mpg sqreg, q (0,25, 0,50, 0,90)
En utilisant ce résultat, nous pouvons construire les équations de régression estimées pour chaque régression quantile :
(1) 25 e percentile prévu de mpg = 35,22414 – 0,0051724*(poids)
(2) 50 e percentile prévu de mpg = 36,94667 – 0,0053333*(poids)
(3) 90 e percentile prévu de mpg = 47,02632 – 0,0072368*(poids)
Ressources additionnelles
Comment effectuer une régression linéaire simple dans Stata
Comment effectuer une régression linéaire multiple dans Stata
Comment effectuer une régression quadratique dans Stata