Como realizar regressão linear múltipla no stata


A regressão linear múltipla é um método que você pode usar para compreender a relação entre múltiplas variáveis explicativas e uma variável de resposta.

Este tutorial explica como realizar regressão linear múltipla no Stata.

Exemplo: regressão linear múltipla no Stata

Digamos que queremos saber se as milhas por galão e o peso afetam o preço de um carro. Para testar isso, podemos realizar uma regressão linear múltipla usando milhas por galão e peso como duas variáveis explicativas e preço como variável de resposta.

Conclua as etapas a seguir no Stata para realizar a regressão linear múltipla usando o conjunto de dados chamado auto , que contém dados de 74 carros diferentes.

Etapa 1: carregar dados.

Carregue os dados digitando o seguinte na caixa de comando:

use https://www.stata-press.com/data/r13/auto

Etapa 2: obtenha um resumo dos dados.

Obtenha uma compreensão rápida dos dados com os quais você está trabalhando digitando o seguinte na caixa Comando:

resumir

Resuma os dados no Stata

Podemos ver que existem 12 variáveis diferentes no conjunto de dados, mas as únicas que nos interessam são mpg , peso e preço .

Podemos ver as seguintes estatísticas resumidas básicas sobre essas três variáveis:

preço | média = US$ 6.165, mínimo = US$ 3.291, máximo US$ 15.906

mpg | média = 21,29, mínimo = 12, máximo = 41

peso | média = 3.019 libras, mínimo = 1.760 libras, máximo = 4.840 libras

Etapa 3: execute a regressão linear múltipla.

Digite o seguinte na caixa Comando para realizar uma regressão linear múltipla usando mpg e peso como variáveis explicativas e preço como variável de resposta.

preço de regressão peso mpg

Saída de regressão múltipla no Stata

Veja como interpretar os números mais interessantes no resultado:

Prob > F: 0,000. Este é o valor p para a regressão geral. Como esse valor é inferior a 0,05, isso indica que as variáveis explicativas combinadas de mpg e peso têm uma relação estatisticamente significativa com a variável resposta preço .

R ao quadrado: 0,2934. Esta é a proporção da variância na variável resposta que pode ser explicada pelas variáveis explicativas. Neste exemplo, 29,34% da variação de preço pode ser explicada pelo mpg e pelo peso.

Coef (mpg): -49,512. Isto nos diz a variação média no preço associada a um aumento de uma unidade no mpg, assumindo que o peso permanece constante . Neste exemplo, cada aumento de uma unidade em mpg está associado a uma redução média de cerca de US$ 49,51 no preço, assumindo que o peso permanece constante.

Por exemplo, suponha que os carros A e B pesem 2.000 libras. Se o carro A atingir 20 mpg e o carro B apenas 19 mpg, esperaríamos que o preço do carro A fosse $ 49,51 menor que o preço do carro B.

P>|t| (mpg): 0,567. Este é o valor p associado à estatística de teste para mpg. Como esse valor não é inferior a 0,05, não temos evidências de que o mpg tenha uma relação estatisticamente significativa com o preço.

Coef (peso): 1.746. Isso nos diz a variação média no preço associada ao aumento de uma unidade no peso, assumindo que o mpg permanece constante . Neste exemplo, cada aumento de uma unidade no peso está associado a um aumento médio de cerca de US$ 1,74 no preço, assumindo que o mpg permanece constante.

Por exemplo, digamos que os carros A e B obtenham 20 mpg. Se o carro A pesa meio quilo a mais que o carro B, então o carro A deveria custar $ 1,74 a mais.

P>|t| (peso): 0,008. Este é o valor p associado à estatística de teste de peso. Como este valor é inferior a 0,05, temos evidências suficientes para afirmar que o peso tem uma relação estatisticamente significativa com o preço.

Coef (_cons): 1946.069. Isso nos diz o preço médio de um carro quando o mpg e o peso são zero. Neste exemplo, o preço médio é de US$ 1.946 quando o peso e o mpg são zero. Realmente não faz sentido interpretar isso, já que o peso e o mpg de um carro não podem ser zero, mas o número 1946.069 é necessário para formar uma equação de regressão.

Etapa 4: relatar os resultados.

Finalmente, queremos relatar os resultados da nossa regressão linear múltipla. Aqui está um exemplo de como fazer isso:

A regressão linear múltipla foi realizada para quantificar a relação entre o peso e o mpg de um carro e seu preço. Uma amostra de 74 carros foi utilizada na análise.

Os resultados mostraram que houve uma relação estatisticamente significativa entre peso e preço (t = 2,72, p = 0,008), mas não houve relação estatisticamente significativa entre mpg e preço (e mpg (t = -0,57, p = 0,567).

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *