Come eseguire la regressione gerarchica in stata


La regressione gerarchica è una tecnica che possiamo utilizzare per confrontare diversi modelli lineari.

L’idea di base è che per prima cosa adattiamo un modello di regressione lineare con una singola variabile esplicativa. Successivamente, adattiamo un altro modello di regressione utilizzando una variabile esplicativa aggiuntiva. Se l’R quadrato (la proporzione della varianza nella variabile di risposta che può essere spiegata dalle variabili esplicative) nel secondo modello è significativamente più alto dell’R quadrato nel modello precedente, ciò significa che il secondo modello è migliore.

Ripetiamo quindi il processo di adattamento di ulteriori modelli di regressione con più variabili esplicative e vediamo se i modelli più recenti offrono un miglioramento rispetto ai modelli precedenti.

Questo tutorial fornisce un esempio di come eseguire la regressione gerarchica in Stata.

Esempio: regressione gerarchica in Stata

Utilizzeremo un set di dati integrato chiamato auto per illustrare come eseguire la regressione gerarchica in Stata. Innanzitutto, carica il set di dati digitando quanto segue nella casella di comando:

utilizzo automatico del sistema

Possiamo ottenere un rapido riepilogo dei dati utilizzando il seguente comando:

riassumere

Riepilogo automatico del set di dati in Stata

Possiamo vedere che il set di dati contiene informazioni su 12 diverse variabili per 74 auto in totale.

Adatteremo i seguenti tre modelli di regressione lineare e utilizzeremo la regressione gerarchica per vedere se ciascun modello successivo fornisce o meno un miglioramento significativo rispetto al modello precedente:

Modello 1: prezzo = intercetta + mpg

Modello 2: prezzo = intercetta + mpg + peso

Modello 3: prezzo = intercetta + mpg + peso + rapporto di trasmissione

Per eseguire la regressione gerarchica in Stata, dovremo prima installare il pacchetto Hireg . Per fare ciò, digitare quanto segue nella casella Comando:

trova Hireg

Nella finestra che appare, clicca su Hireg da https://fmwww.bc.edu/RePEc/bocode/h

Installa il pacchetto Hireg in Stata

Nella finestra successiva, fai clic sul collegamento che dice fai clic qui per installare .

Il pacchetto verrà installato in pochi secondi. Quindi, per eseguire una regressione gerarchica, utilizzeremo il seguente comando:

prezzo del noleggio (mpg) (peso) (gear_ratio)

Ecco cosa chiede a Stata di fare:

  • Esegui una regressione gerarchica utilizzando il prezzo come variabile di risposta in ciascun modello.
  • Per il primo modello, utilizzare mpg come variabile esplicativa.
  • Per il secondo modello, aggiungere il peso come variabile esplicativa aggiuntiva.
  • Per il terzo modello, aggiungi gear_ratio come un’altra variabile esplicativa.

Ecco il risultato del primo modello:

Output della regressione gerarchica in Stata

Vediamo che l’R quadrato del modello è 0,2196 e il valore p complessivo (Prob > F) del modello è 0,0000 , che è statisticamente significativo con α = 0,05.

Successivamente, vediamo il risultato del secondo modello:

Output della regressione gerarchica del secondo modello in Stata

Il quadrato R di questo modello è 0,2934 , che è maggiore di quello del primo modello. Per determinare se questa differenza è statisticamente significativa, Stata ha eseguito un test F che ha fornito i seguenti numeri in fondo al risultato:

  • Differenza R al quadrato tra i due modelli = 0,074
  • Statistica F per differenza = 7.416
  • Valore p corrispondente della statistica F = 0,008

Poiché il valore p è inferiore a 0,05, concludiamo che vi è un miglioramento statisticamente significativo nel secondo modello rispetto al primo modello.

Infine, possiamo vedere il risultato del terzo modello:

Regressione gerarchica nell'interpretazione di Stata

Il quadrato R di questo modello è 0,3150 , che è maggiore di quello del secondo modello. Per determinare se questa differenza è statisticamente significativa, Stata ha eseguito un test F che ha fornito i seguenti numeri in fondo al risultato:

  • Differenza R al quadrato tra i due modelli = 0,022
  • Statistica F per differenza = 2.206
  • Valore p corrispondente della statistica F = 0,142

Poiché il valore p non è inferiore a 0,05, non abbiamo prove sufficienti per affermare che il terzo modello fornisca un miglioramento rispetto al secondo modello.

Alla fine del risultato, possiamo vedere che Stata fornisce un riepilogo dei risultati:

La regressione gerarchica dà come risultato Stata

In questo particolare esempio, concluderemmo che il Modello 2 ha offerto un miglioramento significativo rispetto al Modello 1, ma che il Modello 3 non ha offerto un miglioramento significativo rispetto al Modello 2.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *