So führen sie eine logistische regression in excel durch


Die logistische Regression ist eine Methode, mit der wir ein Regressionsmodell anpassen, wenn die Antwortvariable binär ist.

In diesem Tutorial wird erläutert, wie Sie eine logistische Regression in Excel durchführen.

Beispiel: Logistische Regression in Excel

Führen Sie die folgenden Schritte aus, um in Excel eine logistische Regression für einen Datensatz durchzuführen, der angibt, ob College-Basketballspieler basierend auf ihrem GPA in die NBA eingezogen wurden (Draft: 0 = Nein, 1 = Ja). Punkte, Rebounds und Assists in der Vergangenheit. Jahreszeit.

Schritt 1: Geben Sie die Daten ein.

Geben Sie zunächst folgende Daten ein:

Rohdaten in Excel

Schritt 2: Geben Sie die Zellen für die Regressionskoeffizienten ein.

Da wir drei erklärende Variablen im Modell haben (pts, rebs, ast), erstellen wir Zellen für drei Regressionskoeffizienten plus einen für den Ursprung im Modell. Wir werden die Werte für jeden von ihnen auf 0,001 setzen, sie aber später optimieren.

Logistische Regression in Excel

Als Nächstes müssen wir einige neue Spalten erstellen, die wir zur Optimierung dieser Regressionskoeffizienten verwenden, einschließlich Logit, e Logit , Wahrscheinlichkeit und Log-Likelihood.

Schritt 3: Werte für das Logit erstellen.

Als nächstes erstellen wir die Logit-Spalte mit der folgenden Formel:

Logistische Regressionsgleichung in Excel

Schritt 4: Werte für e logit erstellen.

Als nächstes erstellen wir Werte für e logit mit der folgenden Formel:

Logistische Regressionsberechnungen in Excel

Schritt 5: Wahrscheinlichkeitswerte erstellen.

Als nächstes erstellen wir Wahrscheinlichkeitswerte mit der folgenden Formel:

Schritt 6: Erstellen Sie Werte für die Log-Likelihood.

Als nächstes erstellen wir Werte für die Log-Likelihood mit der folgenden Formel:

Log-Likelihood = LN (Wahrscheinlichkeit)

Schritt 7: Ermitteln Sie die Summe der Log-Wahrscheinlichkeiten.

Schließlich ermitteln wir die Summe der Log-Likelihoods, also die Zahl, die wir zu maximieren versuchen, um die Regressionskoeffizienten zu ermitteln.

Schritt 8: Verwenden Sie den Solver, um die Regressionskoeffizienten zu lösen.

Wenn Sie den Solver noch nicht in Excel installiert haben, führen Sie dazu die folgenden Schritte aus:

  • Klicken Sie auf Datei .
  • Klicken Sie auf Optionen .
  • Klicken Sie auf Add-Ins .
  • Klicken Sie auf Solver-Add-in und dann auf Los .
  • Aktivieren Sie im neuen Fenster, das angezeigt wird, das Kontrollkästchen neben „Solver-Add-In“ und klicken Sie dann auf „Los“ .

Sobald der Solver installiert ist, gehen Sie auf der Registerkarte „Daten“ zur Gruppe „Analyse “ und klicken Sie auf „Solver“ . Geben Sie die folgenden Informationen ein:

  • Ziel festlegen: Wählen Sie Zelle H14 aus, die die Summe der Log-Wahrscheinlichkeiten enthält.
  • Durch Modifizieren der Variablenzellen: Wählen Sie den Zellbereich B15:B18, der die Regressionskoeffizienten enthält.
  • Unbeschränkte Variablen nicht negativ machen: Deaktivieren Sie dieses Kontrollkästchen.
  • Wählen Sie eine Lösungsmethode: Wählen Sie nichtlineares GRG.

Klicken Sie dann auf „Auflösen“ .

Der Solver berechnet automatisch die Schätzungen der Regressionskoeffizienten:

Standardmäßig können Regressionskoeffizienten verwendet werden, um die Wahrscheinlichkeit zu ermitteln, dass das Projekt = 0 ist.

Im Allgemeinen interessiert uns jedoch bei der logistischen Regression die Wahrscheinlichkeit, dass die Antwortvariable = 1 ist.

Daher können wir einfach die Vorzeichen der einzelnen Regressionskoeffizienten umkehren:

Logistische Regression in Excel

Diese Regressionskoeffizienten können nun verwendet werden, um die Wahrscheinlichkeit zu ermitteln, dass das Projekt = 1 ist.

Nehmen wir zum Beispiel an, ein Spieler erzielt durchschnittlich 14 Punkte pro Spiel, 4 Rebounds pro Spiel und 5 Assists pro Spiel. Die Wahrscheinlichkeit, dass dieser Spieler in die NBA gedraftet wird, lässt sich wie folgt berechnen:

P(Projekt = 1) = e 3,681193 + 0,112827*(14) -0,39568*(4) – 0,67954*(5) / (1+e 3,681193 + 0,112827*(14) -0,39568*(4) – 0,67954*(5 ) ) = 0,57 .

Da diese Wahrscheinlichkeit größer als 0,5 ist, sagen wir diesen Spieler voraus   wird in die NBA eingezogen.

Verwandte Themen: So erstellen Sie eine ROC-Kurve in Excel (Schritt für Schritt)

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert