Logistieke regressie uitvoeren in excel


Logistische regressie is een methode die we gebruiken om een regressiemodel te fitten wanneer de responsvariabele binair is.

In deze zelfstudie wordt uitgelegd hoe u logistieke regressie uitvoert in Excel.

Voorbeeld: logistische regressie in Excel

Gebruik de volgende stappen om logistieke regressie in Excel uit te voeren voor een gegevensset die aangeeft of universiteitsbasketbalspelers al dan niet zijn opgeroepen voor de NBA (concept: 0 = nee, 1 = ja) op basis van hun GPA. punten, rebounds en assists in het verleden. seizoen.

Stap 1: Voer de gegevens in.

Voer eerst de volgende gegevens in:

Ruwe gegevens in Excel

Stap 2: Voer de cellen voor de regressiecoëfficiënten in.

Omdat we drie verklarende variabelen in het model hebben (pts, rebs, ast), zullen we cellen maken voor drie regressiecoëfficiënten plus één voor de oorsprong in het model. We stellen de waarden voor elk van hen in op 0,001, maar we zullen ze later optimaliseren.

Logistieke regressie in Excel

Vervolgens moeten we een paar nieuwe kolommen maken die we zullen gebruiken om deze regressiecoëfficiënten te optimaliseren, waaronder logit, e logit , waarschijnlijkheid en log waarschijnlijkheid.

Stap 3: Creëer waarden voor de logit.

Vervolgens maken we de logit-kolom met behulp van de volgende formule:

Logistieke regressievergelijking in Excel

Stap 4: Creëer waarden voor e logit .

Vervolgens zullen we waarden voor e logit creëren met behulp van de volgende formule:

Logistieke regressieberekeningen in Excel

Stap 5: Creëer waarschijnlijkheidswaarden.

Vervolgens zullen we waarschijnlijkheidswaarden creëren met behulp van de volgende formule:

Stap 6: Creëer waarden voor logwaarschijnlijkheid.

Vervolgens zullen we waarden creëren voor de logwaarschijnlijkheid met behulp van de volgende formule:

Log waarschijnlijkheid = LN (waarschijnlijkheid)

Stap 7: Vind de som van de logkansen.

Ten slotte zullen we de som van de logwaarschijnlijkheden vinden, het getal dat we zullen proberen te maximaliseren om de regressiecoëfficiënten op te lossen.

Stap 8: Gebruik de oplosser om de regressiecoëfficiënten op te lossen.

Als u de oplosser nog niet in Excel hebt geïnstalleerd, volgt u deze stappen om dit te doen:

  • Klik op Bestand .
  • Klik op Opties .
  • Klik op Invoegtoepassingen .
  • Klik op Oplosser-invoegtoepassing en klik vervolgens op Go .
  • In het nieuwe venster dat verschijnt, vinkt u het vakje naast Solver Add-In aan en klikt u vervolgens op Go .

Zodra de oplosser is geïnstalleerd, gaat u naar de groep Analyse op het tabblad Gegevens en klikt u op Oplosser . Voer de volgende informatie in:

  • Doel instellen: Kies cel H14 die de som van de logkansen bevat.
  • Door de variabele cellen te wijzigen: kies het celbereik B15:B18 dat de regressiecoëfficiënten bevat.
  • Maak onbeperkte variabelen niet-negatief: schakel dit vakje uit.
  • Selecteer een oplossingsmethode: kies niet-lineaire GRG.

Klik vervolgens op Oplossen .

De Oplosser berekent automatisch de schattingen van de regressiecoëfficiënt:

Standaard kunnen regressiecoëfficiënten worden gebruikt om de waarschijnlijkheid te vinden dat het project = 0.

Over het algemeen zijn we bij logistische regressie echter geïnteresseerd in de waarschijnlijkheid dat de responsvariabele = 1.

We kunnen dus eenvoudig de tekens op elk van de regressiecoëfficiënten omkeren:

logistische regressie in Excel

Deze regressiecoëfficiënten kunnen nu worden gebruikt om de waarschijnlijkheid te vinden dat het project = 1.

Laten we bijvoorbeeld zeggen dat een speler gemiddeld 14 punten per wedstrijd, 4 rebounds per wedstrijd en 5 assists per wedstrijd behaalt. De kans dat deze speler wordt opgeroepen voor de NBA kan als volgt worden berekend:

P(project = 1) = e 3,681193 + 0,112827*(14) -0,39568*(4) – 0,67954*(5) / (1+e 3,681193 + 0,112827*(14 ) -0,39568*(4) – 0,67954*(5 ) ) = 0,57 .

Omdat deze kans groter is dan 0,5, voorspellen we dat deze speler   wordt opgeroepen voor de NBA.

Gerelateerd: Een ROC-curve maken in Excel (stap voor stap)

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert