So berechnen sie das angepasste r-quadrat in python
Das R-Quadrat , oft als R2 geschrieben, ist der Anteil der Varianz in der Antwortvariablen , der durch die Prädiktorvariablen in einem linearen Regressionsmodell erklärt werden kann.
Der Wert von R im Quadrat kann zwischen 0 und 1 liegen. Ein Wert von 0 gibt an, dass die Antwortvariable überhaupt nicht durch die Prädiktorvariable erklärt werden kann, während ein Wert von 1 angibt, dass die Antwortvariable durch die Prädiktorvariable erklärt werden kann. vom Prädiktor perfekt und fehlerfrei erklärt. Variablen.
Das angepasste R-Quadrat ist eine modifizierte Version des R-Quadrats, die die Anzahl der Prädiktoren in einem Regressionsmodell berücksichtigt. Es wird wie folgt berechnet:
Angepasstes R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]
Gold:
- R 2 : Das R 2 des Modells
- n : Die Anzahl der Beobachtungen
- k : Die Anzahl der Prädiktorvariablen
Da R2 immer zunimmt, wenn Sie einem Modell Prädiktoren hinzufügen, kann das angepasste R2 als Metrik dienen, die Ihnen sagt, wie nützlich ein Modell ist, angepasst auf der Grundlage der Anzahl der Prädiktoren in einem Modell .
Dieses Tutorial zeigt zwei Beispiele für die Berechnung des angepassten R2 für ein Regressionsmodell in Python.
Verwandt:Was ist ein guter R-Quadrat-Wert?
Beispiel 1: Berechne das angepasste R-Quadrat mit sklearn
Der folgende Code zeigt, wie man ein multiples lineares Regressionsmodell anpasst und das angepasste R-Quadrat des Modells mit sklearn berechnet:
from sklearn. linear_model import LinearRegression import pandas as pd #define URL where dataset is located url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/mtcars.csv" #read in data data = pd. read_csv (url) #fit regression model model = LinearRegression () x, y = data[["mpg", "wt", "drat", "qsec"]], data.hp model. fit (x,y) #display adjusted R-squared 1 - (1-model. score (X, y))*( len (y)-1)/( len (y)-X. shape [1]-1) 0.7787005290062521
Das angepasste R-Quadrat des Modells beträgt 0,7787 .
Beispiel 2: Berechnen Sie das angepasste R-Quadrat mit statistischen Modellen
Der folgende Code zeigt, wie man ein multiples lineares Regressionsmodell anpasst und das angepasste R-Quadrat des Modells mithilfe von Statistikmodellen berechnet:
import statsmodels. api as sm import pandas as pd #define URL where dataset is located url = "https://raw.githubusercontent.com/Statorials/Python-Guides/main/mtcars.csv" #read in data data = pd. read_csv (url) #fit regression model x, y = data[["mpg", "wt", "drat", "qsec"]], data.hp X = sm. add_constant (X) model = sm. OLS (y,x). fit () #display adjusted R-squared print ( model.rsquared_adj ) 0.7787005290062521
Das angepasste R-Quadrat des Modells beträgt 0,7787 , was dem Ergebnis des vorherigen Beispiels entspricht.
Zusätzliche Ressourcen
So führen Sie eine einfache lineare Regression in Python durch
So führen Sie eine multiple lineare Regression in Python durch
So berechnen Sie den AIC von Regressionsmodellen in Python