I 3 tipi di regressione logistica (compresi gli esempi)


La regressione logistica si riferisce a qualsiasi modello di regressione in cui la variabile di risposta è categoriale.

Esistono tre tipi di modelli di regressione logistica:

  • Regressione logistica binaria : la variabile di risposta può appartenere solo a una delle due categorie.
  • Regressione logistica multinomiale : la variabile di risposta può rientrare in una di tre o più categorie e non esiste un ordinamento naturale tra le categorie.
  • Regressione logistica ordinale : la variabile di risposta può rientrare in una di tre o più categorie ed esiste un ordinamento naturale tra le categorie.

La tabella seguente riassume queste differenze:

tipi di modelli di regressione logistica

Questo tutorial fornisce una breve spiegazione di ciascun tipo di modello di regressione logistica insieme ad esempi di ciascuno.

Tipo n. 1: regressione logistica binaria

I modelli di regressione logistica binaria sono un tipo di regressione logistica in cui la variabile di risposta può rientrare solo in due categorie.

Ecco alcuni esempi:

Esempio 1: Draft NBA

Supponiamo che uno scienziato di dati sportivi desideri utilizzare le variabili predittive (1) punti, (2) rimbalzi e (3) assist per prevedere la probabilità che un determinato giocatore di basket universitario venga arruolato nella NBA.

Poiché ci sono solo due possibili risultati (scritti o non scritti) per la variabile di risposta, lo scienziato dei dati utilizzerebbe un modello di regressione logistica binomiale.

Esempio 2: rilevamento dello spam

Supponiamo che un’azienda desideri utilizzare le variabili predittive (1) conteggio parole e (2) paese di origine per prevedere la probabilità che una determinata email sia spam.

Poiché esistono solo due possibili risultati (spam o non spam) per la variabile di risposta, l’azienda utilizzerebbe un modello di regressione logistica binomiale.

Tipo n°2: Regressione logistica multinomiale

I modelli di regressione logistica multinomiale sono un tipo di regressione logistica in cui la variabile di risposta può rientrare in una di tre o più categorie e non esiste un ordinamento naturale tra le categorie.

Ecco alcuni esempi:

Esempio 1: preferenza politica

Supponiamo che uno scienziato politico voglia utilizzare le variabili predittive (1) reddito annuo e (2) anni di istruzione per prevedere la probabilità che un individuo voterà per uno dei quattro diversi candidati presidenziali.

Poiché ci sono più di due possibili risultati (ci sono quattro potenziali candidati) per la variabile di risposta e non esiste un ordinamento naturale tra i risultati, il politologo utilizzerebbe un modello di regressione logistica multinomiale.

Esempio 2: preferenza sportiva

Supponiamo che un analista sportivo voglia utilizzare le variabili predittive (1) ore di televisione guardate a settimana e (2) età per prevedere la probabilità che un individuo scelga il basket, il calcio o il baseball come sport preferito.

Poiché ci sono più di due possibili risultati (ci sono tre sport) per la variabile di risposta, l’analista sportivo utilizzerà un modello di regressione logistica multinomiale.

Tipo n. 3: regressione logistica ordinale

I modelli di regressione logistica ordinale sono un tipo di regressione logistica in cui la variabile di risposta può rientrare in una di tre o più categorie ed esiste un ordinamento naturale tra le categorie.

Ecco alcuni esempi:

Esempio 1: valutazioni scolastiche

Supponiamo che un consulente universitario voglia utilizzare le variabili predittive (1) GPA, (2) punteggio ACT e (3) punteggio SAT per prevedere la probabilità che un individuo entri in un college che può essere classificato come “cattivo”, “mediocre” . », “buono” o “ottimo”.

Poiché ci sono più di due possibili risultati (ci sono quattro classificazioni della qualità scolastica) per la variabile di risposta e c’è un ordinamento naturale tra i risultati, il consulente scolastico utilizzerebbe un modello di regressione logistica ordinale.

Esempio 2: valutazioni dei film

Supponiamo che un critico cinematografico voglia utilizzare le variabili predittive (1) durata totale e (2) genere per prevedere la probabilità che un dato film riceva un punteggio compreso tra 1 e 10.

Poiché ci sono più di due possibili risultati (ci sono 10 possibili valutazioni) per la variabile di risposta e c’è un ordinamento naturale tra i risultati, il critico cinematografico utilizzerebbe un modello di regressione logistica ordinale.

Risorse addizionali

Le seguenti esercitazioni forniscono ulteriori dettagli sui modelli di regressione logistica:

Introduzione alla regressione logistica
Le 6 ipotesi di regressione logistica
4 esempi di utilizzo della regressione logistica nella vita reale

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *