So berechnen sie das angepasste r-quadrat in python


Das R-Quadrat , oft als R2 geschrieben, ist der Anteil der Varianz in der Antwortvariablen , der durch die Prädiktorvariablen in einem linearen Regressionsmodell erklärt werden kann.

Der Wert von R im Quadrat kann zwischen 0 und 1 liegen. Ein Wert von 0 gibt an, dass die Antwortvariable überhaupt nicht durch die Prädiktorvariable erklärt werden kann, während ein Wert von 1 angibt, dass die Antwortvariable durch die Prädiktorvariable erklärt werden kann. vom Prädiktor perfekt und fehlerfrei erklärt. Variablen.

Das angepasste R-Quadrat ist eine modifizierte Version des R-Quadrats, die die Anzahl der Prädiktoren in einem Regressionsmodell berücksichtigt. Es wird wie folgt berechnet:

Angepasstes R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

Gold:

  • R 2 : Das R 2 des Modells
  • n : Die Anzahl der Beobachtungen
  • k : Die Anzahl der Prädiktorvariablen

Da R2 immer zunimmt, wenn Sie einem Modell Prädiktoren hinzufügen, kann das angepasste R2 als Metrik dienen, die Ihnen sagt, wie nützlich ein Modell ist, angepasst auf der Grundlage der Anzahl der Prädiktoren in einem Modell .

Dieses Tutorial zeigt zwei Beispiele für die Berechnung des angepassten R2 für ein Regressionsmodell in Python.

Verwandt:Was ist ein guter R-Quadrat-Wert?

Beispiel 1: Berechne das angepasste R-Quadrat mit sklearn

Der folgende Code zeigt, wie man ein multiples lineares Regressionsmodell anpasst und das angepasste R-Quadrat des Modells mit sklearn berechnet:

 from sklearn. linear_model import LinearRegression
import pandas as pd

#define URL where dataset is located
url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/mtcars.csv"

#read in data
data = pd. read_csv (url)

#fit regression model
model = LinearRegression ()
x, y = data[["mpg", "wt", "drat", "qsec"]], data.hp
model. fit (x,y)

#display adjusted R-squared
1 - (1-model. score (X, y))*( len (y)-1)/( len (y)-X. shape [1]-1)

0.7787005290062521

Das angepasste R-Quadrat des Modells beträgt 0,7787 .

Beispiel 2: Berechnen Sie das angepasste R-Quadrat mit statistischen Modellen

Der folgende Code zeigt, wie man ein multiples lineares Regressionsmodell anpasst und das angepasste R-Quadrat des Modells mithilfe von Statistikmodellen berechnet:

 import statsmodels. api as sm
import pandas as pd

#define URL where dataset is located
url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/mtcars.csv"

#read in data
data = pd. read_csv (url)

#fit regression model
x, y = data[["mpg", "wt", "drat", "qsec"]], data.hp
X = sm. add_constant (X)
model = sm. OLS (y,x). fit ()

#display adjusted R-squared
print ( model.rsquared_adj )

0.7787005290062521

Das angepasste R-Quadrat des Modells beträgt 0,7787 , was dem Ergebnis des vorherigen Beispiels entspricht.

Zusätzliche Ressourcen

So führen Sie eine einfache lineare Regression in Python durch
So führen Sie eine multiple lineare Regression in Python durch
So berechnen Sie den AIC von Regressionsmodellen in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert