Come calcolare il bic in r


Il criterio informativo bayesiano , spesso abbreviato BIC , è una misura utilizzata per confrontare la bontà dell’adattamento di diversi modelli di regressione.

In pratica, adattiamo più modelli di regressione allo stesso set di dati e scegliamo il modello con il valore BIC più basso come modello che meglio si adatta ai dati.

Utilizziamo la seguente formula per calcolare il BIC:

BIC: (RSS+log(n)dσ̂ 2 ) / n

Oro:

  • d: il numero di predittori
  • n: osservazioni totali
  • σ̂: Stima della varianza dell’errore associata a ciascuna misura di risposta in un modello di regressione
  • RSS: somma residua dei quadrati dal modello di regressione
  • TSS: somma totale dei quadrati del modello di regressione

Il seguente esempio passo passo mostra come calcolare i valori BIC per i modelli di regressione in R.

Passaggio 1: visualizzare i dati

Per questo esempio, utilizzeremo il set di dati mtcars integrato:

 #view first six rows of mtcars dataset
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

Passaggio 2: installa più modelli

Successivamente, adatteremo diversi modelli di regressione utilizzando questo set di dati:

 #fit three different regression models
model1 <- lm(mpg ~ disp + hp, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

Passaggio 3: Scegli il modello con il BIC più basso

Per calcolare il valore BIC per ciascun modello, possiamo utilizzare la funzione BIC() dal pacchetto flexmix :

 library (flexmix)

#calculate BIC of model1
BIC(model1)

[1] 174.4815

#calculate BIC of model2
BIC(model2)

[1] 177.7048

#calculate BIC of model3
BIC(model3)

[1] 170.0307

Possiamo vedere i valori BIC per ciascun modello:

  • BIC del modello 1 : 174.4815
  • Modello 2 BIC: 177.7048
  • Modello 3 BIC: 170.0307

Poiché il modello 3 ha il valore BIC più basso, lo sceglieremo come il modello che meglio si adatta al set di dati.

Risorse addizionali

I seguenti tutorial spiegano come adattare i modelli di regressione comuni in R:

Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R
Come eseguire la regressione logistica in R
Come eseguire la regressione dei minimi quadrati ponderati in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *