So berechnen sie den bic in r
Das Bayes’sche Informationskriterium , oft als BIC abgekürzt, ist ein Maß zum Vergleich der Anpassungsgüte verschiedener Regressionsmodelle.
In der Praxis passen wir mehrere Regressionsmodelle an denselben Datensatz an und wählen das Modell mit dem niedrigsten BIC-Wert als das Modell aus, das am besten zu den Daten passt.
Zur Berechnung des BIC verwenden wir folgende Formel:
BIC: (RSS+log(n)dσ̂ 2 ) / n
Gold:
- d: Die Anzahl der Prädiktoren
- n: Gesamtbeobachtungen
- σ̂: Schätzung der Fehlervarianz, die jedem Antwortmaß in einem Regressionsmodell zugeordnet ist
- RSS: Residualsumme der Quadrate aus dem Regressionsmodell
- TSS: Gesamtsumme der Quadrate des Regressionsmodells
Das folgende Schritt-für-Schritt-Beispiel zeigt, wie BIC-Werte für Regressionsmodelle in R berechnet werden.
Schritt 1: Daten anzeigen
Für dieses Beispiel verwenden wir den integrierten mtcars -Datensatz:
#view first six rows of mtcars dataset
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1
Schritt 2: Installieren Sie mehrere Vorlagen
Als Nächstes werden wir mithilfe dieses Datensatzes verschiedene Regressionsmodelle anpassen:
#fit three different regression models
model1 <- lm(mpg ~ disp + hp, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)
Schritt 3: Wählen Sie das Modell mit dem niedrigsten BIC
Um den BIC-Wert für jedes Modell zu berechnen, können wir die Funktion BIC() aus dem Flexmix- Paket verwenden:
library (flexmix)
#calculate BIC of model1
BIC(model1)
[1] 174.4815
#calculate BIC of model2
BIC(model2)
[1] 177.7048
#calculate BIC of model3
BIC(model3)
[1] 170.0307
Wir können die BIC-Werte für jedes Modell sehen:
- BIC von Modell 1 : 174.4815
- Modell 2 BIC: 177.7048
- Modell 3 BIC: 170.0307
Da Modell 3 den niedrigsten BIC-Wert aufweist, wählen wir es als das Modell aus, das am besten zum Datensatz passt.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie gängige Regressionsmodelle in R angepasst werden:
So führen Sie eine einfache lineare Regression in R durch
So führen Sie eine multiple lineare Regression in R durch
So führen Sie eine logistische Regression in R durch
So führen Sie eine gewichtete Regression der kleinsten Quadrate in R durch