So führen sie eine multiple lineare regression in stata durch


Die multiple lineare Regression ist eine Methode, mit der Sie die Beziehung zwischen mehreren erklärenden Variablen und einer Antwortvariablen verstehen können.

In diesem Tutorial wird erläutert, wie Sie in Stata eine multiple lineare Regression durchführen.

Beispiel: Multiple lineare Regression in Stata

Nehmen wir an, wir möchten wissen, ob Meilen pro Gallone und Gewicht den Preis eines Autos beeinflussen. Um dies zu testen, können wir eine multiple lineare Regression durchführen, indem wir Meilen pro Gallone und Gewicht als die beiden erklärenden Variablen und den Preis als Antwortvariable verwenden.

Führen Sie die folgenden Schritte in Stata aus, um eine multiple lineare Regression mit dem Datensatz namens auto durchzuführen, der Daten zu 74 verschiedenen Autos enthält.

Schritt 1: Daten laden.

Laden Sie die Daten, indem Sie Folgendes in das Befehlsfeld eingeben:

Verwenden Sie https://www.stata-press.com/data/r13/auto

Schritt 2: Erhalten Sie eine Datenzusammenfassung.

Verschaffen Sie sich einen schnellen Überblick über die Daten, mit denen Sie arbeiten, indem Sie Folgendes in das Befehlsfeld eingeben:

zusammenfassen

Daten in Stata zusammenfassen

Wir können sehen, dass der Datensatz 12 verschiedene Variablen enthält, aber die einzigen, die uns interessieren, sind mpg , Gewicht und Preis .

Wir können die folgenden grundlegenden zusammenfassenden Statistiken zu diesen drei Variablen sehen:

Preis | Durchschnitt = 6.165 $, Minimum = 3.291 $, Maximum 15.906 $

mpg | Durchschnitt = 21,29, Min. = 12, Max. = 41

Gewicht | Durchschnitt = 3.019 Pfund, Minimum = 1.760 Pfund, Maximum = 4.840 Pfund

Schritt 3: Führen Sie eine multiple lineare Regression durch.

Geben Sie Folgendes in das Befehlsfeld ein, um eine multiple lineare Regression mit mpg und Gewicht als erklärenden Variablen und Preis als Antwortvariable durchzuführen.

Regressionspreis mpg Gewicht

Mehrere Regressionsausgaben in Stata

So interpretieren Sie die interessantesten Zahlen im Ergebnis:

Wahrscheinlich > F: 0,000. Dies ist der p-Wert für die Gesamtregression. Da dieser Wert kleiner als 0,05 ist, weist dies darauf hin, dass die kombinierten erklärenden Variablen mpg und Gewicht eine statistisch signifikante Beziehung zur Antwortvariablen Preis haben.

R im Quadrat: 0,2934. Dies ist der Anteil der Varianz der Antwortvariablen, der durch die erklärenden Variablen erklärt werden kann. In diesem Beispiel können 29,34 % der Preisschwankung durch mpg und Gewicht erklärt werden.

Koeffizient (mpg): -49,512. Daraus ersehen wir die durchschnittliche Preisänderung, die mit einer Erhöhung der mpg um eine Einheit einhergeht, vorausgesetzt, das Gewicht bleibt konstant . In diesem Beispiel ist jede Erhöhung der mpg um eine Einheit mit einem durchschnittlichen Preisrückgang von etwa 49,51 US-Dollar verbunden, vorausgesetzt, das Gewicht bleibt konstant.

Nehmen wir zum Beispiel an, dass die Autos A und B beide 2.000 Pfund wiegen. Wenn Auto A 20 mpg und Auto B nur 19 mpg hat, würden wir erwarten, dass der Preis von Auto A 49,51 $ unter dem Preis von Auto B liegt.

P>|t| (mpg): 0,567. Dies ist der p-Wert, der der Teststatistik für mpg zugeordnet ist. Da dieser Wert nicht weniger als 0,05 beträgt, haben wir keine Hinweise darauf, dass MPG einen statistisch signifikanten Zusammenhang mit dem Preis hat.

Koeffizient (Gewicht): 1.746. Dies zeigt uns die durchschnittliche Preisänderung, die mit einer Gewichtszunahme um eine Einheit verbunden ist, unter der Annahme, dass der MPG-Wert konstant bleibt . In diesem Beispiel ist jede Gewichtszunahme um eine Einheit mit einem durchschnittlichen Preisanstieg von etwa 1,74 US-Dollar verbunden, vorausgesetzt, die MPG bleiben konstant.

Nehmen wir zum Beispiel an, dass die Autos A und B beide 20 mpg haben. Wenn Auto A ein Pfund mehr wiegt als Auto B, dann müsste Auto A 1,74 $ mehr kosten.

P>|t| (Gewicht): 0,008. Dies ist der p-Wert, der der Teststatistik für das Gewicht zugeordnet ist. Da dieser Wert unter 0,05 liegt, haben wir genügend Beweise dafür, dass das Gewicht einen statistisch signifikanten Zusammenhang mit dem Preis hat.

Koeffizient (_cons): 1946.069. Dies gibt uns den Durchschnittspreis eines Autos an, wenn mpg und Gewicht Null sind. In diesem Beispiel beträgt der Durchschnittspreis 1.946 $, wenn Gewicht und mpg null sind. Dies ist nicht wirklich sinnvoll zu interpretieren, da das Gewicht und die mpg eines Autos nicht Null sein können, aber die Zahl 1946,069 wird benötigt, um eine Regressionsgleichung zu bilden.

Schritt 4: Melden Sie die Ergebnisse.

Abschließend möchten wir über die Ergebnisse unserer multiplen linearen Regression berichten. Hier ist ein Beispiel dafür:

Es wurde eine multiple lineare Regression durchgeführt, um die Beziehung zwischen dem Gewicht und den mpg eines Autos und seinem Preis zu quantifizieren. Für die Analyse wurde eine Stichprobe von 74 Autos verwendet.

Die Ergebnisse zeigten, dass es einen statistisch signifikanten Zusammenhang zwischen Gewicht und Preis gab (t = 2,72, p = 0,008), aber keinen statistisch signifikanten Zusammenhang zwischen mpg und Preis (und mpg (t = -0,57, p = 0,567).

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert