Cos'è un modello nidificato? (definizione & #038; esempio)


Un modello nidificato è semplicemente un modello di regressione che contiene un sottoinsieme di variabili predittive in un altro modello di regressione.

Ad esempio, supponiamo di avere il seguente modello di regressione (chiamiamolo Modello A) che prevede il numero di punti segnati da un giocatore di basket sulla base di quattro variabili predittive:

Punti = β 0 + β 1 (minuti) + β 2 (altezza) + β 3 (posizione) + β 4 (tiri) + ε

Un esempio di modello nidificato (chiamiamolo Modello B) sarebbe il seguente modello con solo due variabili predittive del Modello A:

Punti = β 0 + β 1 (minuti) + β 2 (altezza) + ε

Diremmo che il Modello B è nidificato all’interno del Modello A perché il Modello B contiene un sottoinsieme delle variabili predittive del Modello A.

Tuttavia, considera se avessimo un altro modello (chiamiamolo Modello C) contenente tre variabili predittive:

Punti = β 0 + β 1 (minuti) + β 2 (altezza) + β 3 (tiri liberi tentati)

Non diremmo che il Modello C è nidificato all’interno del Modello A perché ciascun modello contiene variabili predittive che l’altro modello non contiene.

L’importanza dei modelli nidificati

Nella pratica utilizziamo spesso modelli nidificati quando vogliamo sapere se un modello con un set completo di variabili predittive può adattarsi a un set di dati meglio di un modello con un sottoinsieme di tali variabili predittive.

Ad esempio, nello scenario precedente, potremmo adattare un modello completo utilizzando minuti giocati, altezza, posizione e tiri tentati per prevedere il numero di punti segnati dai giocatori di basket.

Tuttavia, potremmo sospettare che la posizione e i tentativi di tiro potrebbero non prevedere molto bene i punti segnati.

Pertanto, potremmo adattare un modello nidificato che utilizza solo i minuti giocati e il campo per prevedere i punti segnati.

Possiamo quindi confrontare i due modelli per determinare se esiste una differenza statisticamente significativa.

Se non c’è differenza significativa tra i modelli, possiamo rimuovere la posizione e i tiri tentati come variabili predittive perché non migliorano significativamente il modello.

Come analizzare i modelli nidificati

Per determinare se un modello nidificato è significativamente diverso da un modello “completo”, in genere eseguiamo un test del rapporto di verosimiglianza che utilizza le seguenti ipotesi nulle e alternative:

H 0 : il modello completo e il modello nidificato si adattano ugualmente bene ai dati. Quindi, dovresti usare il modello nidificato .

H R : Il modello completo si adatta ai dati in modo decisamente migliore rispetto al modello nidificato. Quindi devi utilizzare il modello completo .

Un test del rapporto di verosimiglianza produce una statistica del test Chi-quadrato e il corrispondente valore p.

Se il valore p del test è inferiore a un certo livello di significatività (ad esempio 0,05), allora possiamo rifiutare l’ipotesi nulla e concludere che il modello completo fornisce un adattamento significativamente migliore.

I seguenti tutorial spiegano come eseguire un test del rapporto di verosimiglianza utilizzando R e Python:

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *