Comment effectuer une régression linéaire multiple dans Stata



La régression linéaire multiple est une méthode que vous pouvez utiliser pour comprendre la relation entre plusieurs variables explicatives et une variable de réponse.

Ce tutoriel explique comment effectuer une régression linéaire multiple dans Stata.

Exemple : régression linéaire multiple dans Stata

Supposons que nous voulions savoir si les kilomètres par gallon et le poids ont un impact sur le prix d’une voiture. Pour tester cela, nous pouvons effectuer une régression linéaire multiple en utilisant les miles par gallon et le poids comme deux variables explicatives et le prix comme variable de réponse.

Effectuez les étapes suivantes dans Stata pour effectuer une régression linéaire multiple à l’aide de l’ensemble de données appelé auto , qui contient des données sur 74 voitures différentes.

Étape 1 : Chargez les données.

Chargez les données en tapant ce qui suit dans la zone de commande :

utilisez https://www.stata-press.com/data/r13/auto

Étape 2 : Obtenez un résumé des données.

Obtenez une compréhension rapide des données avec lesquelles vous travaillez en tapant ce qui suit dans la zone Commande :

résumer

Résumer les données dans Stata

Nous pouvons voir qu’il y a 12 variables différentes dans l’ensemble de données, mais les seules qui nous intéressent sont mpg , weight et price .

Nous pouvons voir les statistiques récapitulatives de base suivantes sur ces trois variables :

prix | moyenne = 6 165 $, min = 3 291 $, maximum 15 906 $

mpg | moyenne = 21,29, min = 12, max = 41

poids | moyenne = 3 019 livres, min = 1 760 livres, maximum = 4 840 livres

Étape 3 : Effectuez une régression linéaire multiple.

Tapez ce qui suit dans la zone Commande pour effectuer une régression linéaire multiple en utilisant mpg et poids comme variables explicatives et le prix comme variable de réponse.

régression prix mpg poids

Sortie de régression multiple dans Stata

Voici comment interpréter les nombres les plus intéressants du résultat :

Prob > F : 0,000. Il s’agit de la valeur p pour la régression globale. Puisque cette valeur est inférieure à 0,05, cela indique que les variables explicatives combinées du mpg et du poids ont une relation statistiquement significative avec la variable de réponse prix .

R au carré : 0,2934. Il s’agit de la proportion de la variance de la variable de réponse qui peut être expliquée par les variables explicatives. Dans cet exemple, 29,34 % de la variation du prix peut être expliquée par le mpg et le poids.

Coef (mpg) : -49,512. Cela nous indique la variation moyenne du prix associée à une augmentation d’une unité du mpg, en supposant que le poids reste constant . Dans cet exemple, chaque augmentation d’une unité de mpg est associée à une diminution moyenne d’environ 49,51 $ du prix, en supposant que le poids reste constant.

Par exemple, supposons que les voitures A et B pèsent toutes deux 2 000 livres. Si la voiture A consomme 20 mpg et la voiture B seulement 19 mpg, nous nous attendrions à ce que le prix de la voiture A soit 49,51 $ de moins que le prix de la voiture B.

P>|t| (mpg): 0,567. Il s’agit de la valeur p associée à la statistique de test pour mpg. Puisque cette valeur n’est pas inférieure à 0,05, nous n’avons aucune preuve indiquant que le mpg a une relation statistiquement significative avec le prix.

Coef (poids) : 1,746. Cela nous indique la variation moyenne du prix associée à une augmentation d’une unité de poids, en supposant que le mpg reste constant . Dans cet exemple, chaque augmentation d’une unité de poids est associée à une augmentation moyenne d’environ 1,74 $ du prix, en supposant que le mpg reste constant.

Par exemple, supposons que les voitures A et B consomment toutes deux 20 mpg. Si la voiture A pèse une livre de plus que la voiture B, alors la voiture A devrait coûter 1,74 $ de plus.

P>|t| (poids) : 0,008. Il s’agit de la valeur p associée à la statistique de test pour le poids. Puisque cette valeur est inférieure à 0,05, nous disposons de suffisamment de preuves pour affirmer que le poids a une relation statistiquement significative avec le prix.

Coef (_cons) : 1946.069. Cela nous indique le prix moyen d’une voiture lorsque le mpg et le poids sont nuls. Dans cet exemple, le prix moyen est de 1 946 $ lorsque le poids et le mpg sont nuls. Cela n’a pas vraiment de sens à interpréter puisque le poids et le mpg d’une voiture ne peuvent pas être nuls, mais le nombre 1946.069 est nécessaire pour former une équation de régression.

Étape 4 : Rapportez les résultats.

Enfin, nous souhaitons rapporter les résultats de notre régression linéaire multiple. Voici un exemple de la façon de procéder :

Une régression linéaire multiple a été réalisée pour quantifier la relation entre le poids et le mpg d’une voiture et son prix. Un échantillon de 74 voitures a été utilisé dans l’analyse.

Les résultats ont montré qu’il y avait une relation statistiquement significative entre le poids et le prix (t = 2,72, p = 0,008), mais il n’y avait pas de relation statistiquement significative entre mpg et le prix (et mpg (t = -0,57, p = 0,567). .

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *