Hoe meervoudige lineaire regressie uit te voeren in stata
Meervoudige lineaire regressie is een methode die u kunt gebruiken om de relatie tussen meerdere verklarende variabelen en een responsvariabele te begrijpen.
In deze tutorial wordt uitgelegd hoe u meervoudige lineaire regressie uitvoert in Stata.
Voorbeeld: meervoudige lineaire regressie in Stata
Laten we zeggen dat we willen weten of het aantal kilometers per gallon en het gewicht van invloed zijn op de prijs van een auto. Om dit te testen kunnen we een meervoudige lineaire regressie uitvoeren met kilometers per gallon en gewicht als twee verklarende variabelen en de prijs als responsvariabele.
Voer de volgende stappen in Stata uit om meervoudige lineaire regressie uit te voeren met behulp van de dataset genaamd auto , die gegevens over 74 verschillende auto’s bevat.
Stap 1: Gegevens laden.
Laad de gegevens door het volgende in het opdrachtvenster te typen:
gebruik https://www.stata-press.com/data/r13/auto
Stap 2: Krijg een gegevensoverzicht.
Krijg snel inzicht in de gegevens waarmee u werkt door het volgende in het opdrachtvak te typen:
samenvatten
We kunnen zien dat er 12 verschillende variabelen in de dataset zitten, maar de enige waarin we geïnteresseerd zijn zijn mpg , weight en price .
We kunnen de volgende samenvattende basisstatistieken over deze drie variabelen zien:
prijs | gemiddeld = $6.165, min = $3.291, maximaal $15.906
mpg | gemiddeld = 21,29, min = 12, max = 41
gewicht | gemiddeld = 3.019 pond, min = 1.760 pond, maximum = 4.840 pond
Stap 3: Voer meerdere lineaire regressie uit.
Typ het volgende in het vak Opdracht om een meervoudige lineaire regressie uit te voeren met mpg en gewicht als verklarende variabelen en prijs als responsvariabele.
regressie prijs mpg gewicht
Zo interpreteert u de meest interessante cijfers in het resultaat:
Waarschijnlijk > F: 0,000. Dit is de p-waarde voor de algehele regressie. Aangezien deze waarde kleiner is dan 0,05, geeft dit aan dat de gecombineerde verklarende variabelen mpg en gewicht een statistisch significante relatie hebben met de responsvariabele price .
R kwadraat: 0,2934. Dit is het deel van de variantie in de responsvariabele dat kan worden verklaard door de verklarende variabelen. In dit voorbeeld kan 29,34% van de prijsvariatie worden verklaard door mpg en gewicht.
Coef (mpg): -49,512. Dit vertelt ons de gemiddelde prijsverandering die gepaard gaat met een stijging van de mpg met één eenheid, ervan uitgaande dat het gewicht constant blijft . In dit voorbeeld gaat elke stijging van de mpg met één eenheid gepaard met een gemiddelde prijsdaling van ongeveer $ 49,51, ervan uitgaande dat het gewicht constant blijft.
Stel bijvoorbeeld dat auto A en B beide 2.000 pond wegen. Als auto A 20 mpg krijgt en auto B slechts 19 mpg, verwachten we dat de prijs van auto A $ 49,51 minder is dan de prijs van auto B.
P>|t| (mpg): 0,567. Dit is de p-waarde die is gekoppeld aan de teststatistiek voor mpg. Aangezien deze waarde niet minder dan 0,05 bedraagt, hebben we geen bewijs dat mpg een statistisch significante relatie heeft met de prijs.
Coef (gewicht): 1.746. Dit vertelt ons de gemiddelde prijsverandering die gepaard gaat met een gewichtstoename van één eenheid, ervan uitgaande dat mpg constant blijft . In dit voorbeeld gaat elke gewichtstoename van één eenheid gepaard met een gemiddelde prijsstijging van ongeveer $ 1,74, ervan uitgaande dat het mpg constant blijft.
Laten we bijvoorbeeld zeggen dat auto’s A en B beide 20 mpg krijgen. Als auto A één pond meer weegt dan auto B, dan zou auto A $ 1,74 meer moeten kosten.
P>|t| (gewicht): 0,008. Dit is de p-waarde die is gekoppeld aan de teststatistiek voor gewicht. Omdat deze waarde kleiner is dan 0,05, hebben we voldoende bewijs om te zeggen dat gewicht een statistisch significante relatie heeft met de prijs.
Coef (_cons): 1946.069. Dit vertelt ons de gemiddelde prijs van een auto wanneer mpg en gewicht nul zijn. In dit voorbeeld is de gemiddelde prijs $ 1.946 wanneer het gewicht en de mpg nul zijn. Dit is niet echt logisch om te interpreteren, aangezien het gewicht en de mpg van een auto niet nul kunnen zijn, maar het getal 1946.069 is nodig om een regressievergelijking te vormen.
Stap 4: Rapporteer de resultaten.
Ten slotte willen we de resultaten van onze meervoudige lineaire regressie rapporteren. Hier is een voorbeeld van hoe u dit kunt doen:
Er werd meerdere lineaire regressie uitgevoerd om de relatie tussen het gewicht en mpg van een auto en de prijs ervan te kwantificeren. Voor de analyse is gebruik gemaakt van een steekproef van 74 auto’s.
Uit de resultaten bleek dat er een statistisch significante relatie was tussen gewicht en prijs (t = 2,72, p = 0,008), maar er was geen statistisch significante relatie tussen mpg en prijs (en mpg (t = -0,57, p = 0,567).