Come eseguire la regressione logistica in excel
La regressione logistica è un metodo che utilizziamo per adattare un modello di regressione quando la variabile di risposta è binaria.
Questo tutorial spiega come eseguire la regressione logistica in Excel.
Esempio: regressione logistica in Excel
Utilizzare i passaggi seguenti per eseguire la regressione logistica in Excel per un set di dati che indica se i giocatori di basket del college sono stati arruolati o meno nell’NBA (draft: 0 = no, 1 = sì) in base al loro GPA. punti, rimbalzi e assist in passato. stagione.
Passaggio 1: inserisci i dati.
Per prima cosa inserisci i seguenti dati:
Passaggio 2: immettere le celle per i coefficienti di regressione.
Poiché nel modello sono presenti tre variabili esplicative (pts, rebs, ast), creeremo celle per tre coefficienti di regressione più uno per l’origine nel modello. Imposteremo i valori per ciascuno di essi su 0,001, ma li ottimizzeremo in seguito.
Successivamente, dovremo creare alcune nuove colonne che utilizzeremo per ottimizzare questi coefficienti di regressione, inclusi logit, e logit , probabilità e log verosimiglianza.
Passaggio 3: crea valori per il logit.
Successivamente, creeremo la colonna logit utilizzando la seguente formula:
Passaggio 4: crea valori per e logit .
Successivamente, creeremo valori per e logit utilizzando la seguente formula:
Passaggio 5: creare valori di probabilità.
Successivamente, creeremo valori di probabilità utilizzando la seguente formula:
Passaggio 6: creare valori per la verosimiglianza del log.
Successivamente, creeremo valori per la probabilità del log utilizzando la seguente formula:
Log probabilità = LN (probabilità)
Passaggio 7: Trova la somma delle probabilità logaritmiche.
Infine, troveremo la somma delle verosimiglianze, ovvero il numero che cercheremo di massimizzare per risolvere i coefficienti di regressione.
Passaggio 8: utilizzare il risolutore per risolvere i coefficienti di regressione.
Se non hai già installato il risolutore in Excel, segui questi passaggi per farlo:
- Fare clic su File .
- Fare clic su Opzioni .
- Fare clic su Componenti aggiuntivi .
- Fare clic su Componente aggiuntivo Risolutore e quindi su Vai .
- Nella nuova finestra visualizzata, seleziona la casella accanto a Componente aggiuntivo Risolutore , quindi fai clic su Vai .
Una volta installato il risolutore, vai al gruppo Analisi nella scheda Dati e fai clic su Risolutore . Inserisci le seguenti informazioni:
- Imposta obiettivo: scegli la cella H14 che contiene la somma delle probabilità logaritmiche.
- Modificando le celle delle variabili: scegliere l’intervallo di celle B15:B18 che contiene i coefficienti di regressione.
- Rendi le variabili non vincolate non negative: deseleziona questa casella.
- Seleziona un metodo di soluzione: scegli GRG non lineare.
Quindi fare clic su Risolvi .
Il Risolutore calcola automaticamente le stime dei coefficienti di regressione:
Per impostazione predefinita, è possibile utilizzare coefficienti di regressione per trovare la probabilità che il progetto = 0.
Tuttavia, generalmente nella regressione logistica siamo interessati alla probabilità che la variabile di risposta = 1.
Pertanto, possiamo semplicemente invertire i segni su ciascuno dei coefficienti di regressione:
Questi coefficienti di regressione possono ora essere utilizzati per trovare la probabilità che il progetto = 1.
Ad esempio, supponiamo che un giocatore abbia una media di 14 punti a partita, 4 rimbalzi a partita e 5 assist a partita. La probabilità che questo giocatore venga arruolato nella NBA può essere calcolata come segue:
P(progetto = 1) = e 3,681193 + 0,112827*(14) -0,39568*(4) – 0,67954*(5) / (1+e 3,681193 + 0,112827*(14 ) -0,39568*(4) – 0,67954*(5 ) ) = 0,57 .
Poiché questa probabilità è maggiore di 0,5, prevediamo che questo giocatore essere arruolato nella NBA.
Correlati: Come creare una curva ROC in Excel (passo dopo passo)