So führen sie eine logistische regression in stata durch


Die logistische Regression ist eine Methode, mit der wir ein Regressionsmodell anpassen, wenn die Antwortvariable binär ist. Hier sind einige Beispiele für die Verwendung der logistischen Regression:

  • Wir wollen wissen, wie sich Bewegung, Ernährung und Gewicht auf die Wahrscheinlichkeit eines Herzinfarkts auswirken. Die Antwortvariable ist Herzinfarkt und hat zwei mögliche Folgen: Es kommt zu einem Herzinfarkt oder er tritt nicht auf.
  • Wir möchten wissen, wie sich GPA, ACT-Score und die Anzahl der belegten AP-Kurse auf die Wahrscheinlichkeit auswirken, an einer bestimmten Universität angenommen zu werden. Die Antwortvariable ist Akzeptanz und hat zwei mögliche Ergebnisse: akzeptiert oder nicht akzeptiert.
  • Wir möchten wissen, ob die Wortanzahl und der E-Mail-Titel einen Einfluss auf die Wahrscheinlichkeit haben, dass es sich bei einer E-Mail um Spam handelt. Die Antwortvariable ist Spam und hat zwei mögliche Ergebnisse: Spam oder kein Spam.

In diesem Tutorial wird erläutert, wie Sie eine logistische Regression in Stata durchführen.

Beispiel: Logistische Regression in Stata

Angenommen, wir möchten verstehen, ob das Alter und die Rauchgewohnheiten einer Mutter die Wahrscheinlichkeit beeinflussen, ein Baby mit niedrigem Geburtsgewicht zu bekommen.

Um dies zu untersuchen, können wir eine logistische Regression durchführen, indem wir Alter und Rauchen (ja oder nein) als erklärende Variablen und niedriges Geburtsgewicht (ja oder nein) als Antwortvariable verwenden. Da die Antwortvariable binär ist – es gibt nur zwei mögliche Ergebnisse – sollte eine logistische Regression verwendet werden.

Führen Sie die folgenden Schritte in Stata aus, um eine logistische Regression mithilfe des Datensatzes namens lbw durchzuführen, der Daten zu 189 verschiedenen Müttern enthält.

Schritt 1: Daten laden.

Laden Sie die Daten, indem Sie Folgendes in das Befehlsfeld eingeben:

Verwenden Sie https://www.stata-press.com/data/r13/lbw

Schritt 2: Erhalten Sie eine Datenzusammenfassung.

Verschaffen Sie sich einen schnellen Überblick über die Daten, mit denen Sie arbeiten, indem Sie Folgendes in das Befehlsfeld eingeben:

zusammenfassen

Datensatz zu niedrigem Geburtsgewicht in Stata

Wir können sehen, dass der Datensatz 11 verschiedene Variablen enthält, aber die einzigen drei, die uns interessieren, sind:

  • niedrig – unabhängig davon, ob das Baby ein niedriges Geburtsgewicht hat oder nicht. 1 = ja, 0 = nein.
  • Alter – Alter der Mutter.
  • Rauchen – unabhängig davon, ob die Mutter während der Schwangerschaft geraucht hat oder nicht. 1 = ja, 0 = nein.

Schritt 3: Führen Sie eine logistische Regression durch.

Geben Sie Folgendes in das Befehlsfeld ein, um eine logistische Regression durchzuführen, wobei Alter und Rauch als erklärende Variablen und niedrig als Antwortvariable verwendet werden.

Rauch im niedrigen Alter Logit

Logistische Regressionsausgabe in Stata

So interpretieren Sie die interessantesten Zahlen im Ergebnis:

Koeffizient (Alter): -.0497792. Wenn man den Rauch konstant hält, ist jedes Jahr mit zunehmendem Alter mit einer um (-0,0497792) = 0,951 höheren Wahrscheinlichkeit verbunden, dass ein Baby ein niedriges Geburtsgewicht hat. Wenn diese Zahl unter 1 liegt, bedeutet dies, dass ein zunehmendes Alter tatsächlich mit einer geringeren Wahrscheinlichkeit verbunden ist, ein Baby mit niedrigem Geburtsgewicht zu bekommen.

Angenommen, Mutter A und Mutter B rauchen beide. Wenn Mutter A ein Jahr älter ist als Mutter B, beträgt die Wahrscheinlichkeit, dass Mutter A ein Kind mit niedrigem Geburtsgewicht bekommt, nur 95,1 % der Wahrscheinlichkeit, dass Mutter B ein Kind mit niedrigem Geburtsgewicht bekommt. die Geburt.

P>|z| (Alter): 0,119. Dies ist der p-Wert, der der Teststatistik für das Alter zugeordnet ist. Da dieser Wert nicht unter 0,05 liegt, ist das Alter kein statistisch signifikanter Prädiktor für ein niedriges Geburtsgewicht.

Quotenverhältnis (Rauch): 0,6918486. Bei konstantem Alter hat eine Mutter, die während der Schwangerschaft raucht, eine höhere Wahrscheinlichkeit exp(.6918486) = 1,997, ein Kind mit niedrigem Geburtsgewicht zu bekommen, als eine Mutter, die während der Schwangerschaft nicht raucht.

Angenommen, Mutter A und Mutter B sind beide 30 Jahre alt. Wenn Mutter A während der Schwangerschaft raucht und Mutter B nicht raucht, ist die Wahrscheinlichkeit, dass Mutter A ein Kind mit niedrigem Geburtsgewicht bekommt, um 99,7 % höher als die Wahrscheinlichkeit, dass Mutter B ein Kind mit niedrigem Geburtsgewicht bekommt.

P>|z| (Rauch): 0,032. Dies ist der p-Wert, der der Teststatistik für Rauch zugeordnet ist. Da dieser Wert unter 0,05 liegt, ist Rauchen ein statistisch signifikanter Prädiktor für ein niedriges Geburtsgewicht.

Schritt 4: Melden Sie die Ergebnisse.

Abschließend möchten wir über die Ergebnisse unserer logistischen Regression berichten. Hier ist ein Beispiel dafür:

Eine logistische Regression wurde durchgeführt, um festzustellen, ob das Alter und die Rauchgewohnheiten einer Mutter die Wahrscheinlichkeit beeinflussen, ein Baby mit niedrigem Geburtsgewicht zu bekommen. Für die Analyse wurde eine Stichprobe von 189 Müttern herangezogen.

Die Ergebnisse zeigten, dass es einen statistisch signifikanten Zusammenhang zwischen Rauchen und der Wahrscheinlichkeit eines niedrigen Geburtsgewichts gab (z = 2,15, p = 0,032), während es keinen statistisch signifikanten Zusammenhang zwischen dem Alter und der Wahrscheinlichkeit eines niedrigen Geburtsgewichts gab (z = -1,56). , p = 0,032). 119).

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert