Hoe regressiecoëfficiënten uit glm() in r te extraheren
U kunt de volgende methoden gebruiken om regressiecoëfficiënten uit de glm() -functie in R te extraheren:
Methode 1: extraheer alle regressiecoëfficiënten
model$coefficients
Methode 2: Extraheer de regressiecoëfficiënt voor een specifieke variabele
model$coefficients[' my_variable ']
Methode 3: Extraheer alle regressiecoëfficiënten met standaardfout, Z-waarde en P-waarde
summary(model)$coefficients
Het volgende voorbeeld laat zien hoe u deze methoden in de praktijk kunt gebruiken.
Voorbeeld: extraheer regressiecoëfficiënten uit glm() in R
Stel dat we een logistisch regressiemodel passen met behulp van de standaarddataset uit het ISLR- pakket:
#load dataset data <- ISLR::Default #view first six rows of data head(data) default student balance income 1 No No 729.5265 44361.625 2 No Yes 817.1804 12106.135 3 No No 1073.5492 31767.139 4 No No 529.2506 35704.494 5 No No 785.6559 38463.496 6 No Yes 919.5885 7491.559 #fit logistic regression model model <- glm(default~student+balance+income, family=' binomial ', data=data) #view summary of logistic regression model summary(model) Call: glm(formula = default ~ student + balance + income, family = "binomial", data = data) Deviance Residuals: Min 1Q Median 3Q Max -2.4691 -0.1418 -0.0557 -0.0203 3.7383 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.087e+01 4.923e-01 -22.080 < 2e-16 *** studentYes -6.468e-01 2.363e-01 -2.738 0.00619 ** balance 5.737e-03 2.319e-04 24.738 < 2e-16 *** income 3.033e-06 8.203e-06 0.370 0.71152 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 2920.6 on 9999 degrees of freedom Residual deviance: 1571.5 on 9996 degrees of freedom AIC: 1579.5 Number of Fisher Scoring iterations: 8
We kunnen model$coefficients typen om alle regressiecoëfficiënten uit het model te extraheren:
#extract all regression coefficients
model$coefficients
(Intercept) studentYes balance income
-1.086905e+01 -6.467758e-01 5.736505e-03 3.033450e-06
We kunnen ook model$coefficients[‚balance‘] typen om de regressiecoëfficiënt alleen voor de balance- variabele te extraheren:
#extract coefficient for 'balance'
model$coefficients[' balance ']
balance
0.005736505
Om de regressiecoëfficiënten samen met hun standaardfouten, z-waarden en p-waarden weer te geven, kunnen we de summary(model)$-coëfficiënten als volgt gebruiken:
#view regression coefficients with standard errors, z values and p-values
summary(model)$coefficients
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.086905e+01 4.922555e-01 -22.080088 4.911280e-108
studentYes -6.467758e-01 2.362525e-01 -2.737646 6.188063e-03
balance 5.736505e-03 2.318945e-04 24.737563 4.219578e-135
income 3.033450e-06 8.202615e-06 0.369815 7.115203e-01
We hebben ook toegang tot specifieke waarden in deze uitvoer.
We kunnen bijvoorbeeld de volgende code gebruiken om toegang te krijgen tot de p-waarde van de balance- variabele:
#view p-value for balance variable summary(model)$coefficients[' balance ', ' Pr(>|z|) '] [1] 4.219578e-135
Of we kunnen de volgende code gebruiken om toegang te krijgen tot de p-waarde voor elk van de regressiecoëfficiënten:
#view p-value for all variables summary(model)$coefficients[, ' Pr(>|z|) '] (Intercept) studentYes balance income 4.911280e-108 6.188063e-03 4.219578e-135 7.115203e-01
Voor elke regressiecoëfficiënt in het model worden P-waarden weergegeven.
U kunt een vergelijkbare syntaxis gebruiken om toegang te krijgen tot elke waarde in de uitvoer.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe eenvoudige lineaire regressie uit te voeren in R
Hoe meervoudige lineaire regressie uit te voeren in R
Hoe logistische regressie uit te voeren in R
Hoe kwadratische regressie uit te voeren in R