Come estrarre i coefficienti di regressione da glm() in r
È possibile utilizzare i seguenti metodi per estrarre i coefficienti di regressione dalla funzione glm() in R:
Metodo 1: estrai tutti i coefficienti di regressione
model$coefficients
Metodo 2: estrarre il coefficiente di regressione per una variabile specifica
model$coefficients[' my_variable ']
Metodo 3: estrarre tutti i coefficienti di regressione con errore standard, valore Z e valore P
summary(model)$coefficients
L’esempio seguente mostra come utilizzare questi metodi nella pratica.
Esempio: estrai i coefficienti di regressione da glm() in R
Supponiamo di adattare un modello di regressione logistica utilizzando il set di dati predefinito dal pacchetto ISLR :
#load dataset data <- ISLR::Default #view first six rows of data head(data) default student balance income 1 No No 729.5265 44361.625 2 No Yes 817.1804 12106.135 3 No No 1073.5492 31767.139 4 No No 529.2506 35704.494 5 No No 785.6559 38463.496 6 No Yes 919.5885 7491.559 #fit logistic regression model model <- glm(default~student+balance+income, family=' binomial ', data=data) #view summary of logistic regression model summary(model) Call: glm(formula = default ~ student + balance + income, family = "binomial", data = data) Deviance Residuals: Min 1Q Median 3Q Max -2.4691 -0.1418 -0.0557 -0.0203 3.7383 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.087e+01 4.923e-01 -22.080 < 2e-16 *** studentYes -6.468e-01 2.363e-01 -2.738 0.00619 ** balance 5.737e-03 2.319e-04 24.738 < 2e-16 *** income 3.033e-06 8.203e-06 0.370 0.71152 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 2920.6 on 9999 degrees of freedom Residual deviance: 1571.5 on 9996 degrees of freedom AIC: 1579.5 Number of Fisher Scoring iterations: 8
Possiamo digitare model$coefficients per estrarre tutti i coefficienti di regressione dal modello:
#extract all regression coefficients
model$coefficients
(Intercept) studentYes balance income
-1.086905e+01 -6.467758e-01 5.736505e-03 3.033450e-06
Possiamo anche digitare model$coefficients[‘balance’] per estrarre il coefficiente di regressione solo per la variabile balance :
#extract coefficient for 'balance'
model$coefficients[' balance ']
balance
0.005736505
Per visualizzare i coefficienti di regressione insieme ai relativi errori standard, valori z e valori p , possiamo utilizzare i coefficienti summary(model)$ come segue:
#view regression coefficients with standard errors, z values and p-values
summary(model)$coefficients
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.086905e+01 4.922555e-01 -22.080088 4.911280e-108
studentYes -6.467758e-01 2.362525e-01 -2.737646 6.188063e-03
balance 5.736505e-03 2.318945e-04 24.737563 4.219578e-135
income 3.033450e-06 8.202615e-06 0.369815 7.115203e-01
Possiamo anche accedere a valori specifici in questo output.
Ad esempio, possiamo utilizzare il seguente codice per accedere al valore p della variabile Balance :
#view p-value for balance variable summary(model)$coefficients[' balance ', ' Pr(>|z|) '] [1] 4.219578e-135
Oppure potremmo usare il seguente codice per accedere al valore p per ciascuno dei coefficienti di regressione:
#view p-value for all variables summary(model)$coefficients[, ' Pr(>|z|) '] (Intercept) studentYes balance income 4.911280e-108 6.188063e-03 4.219578e-135 7.115203e-01
I valori P vengono visualizzati per ciascun coefficiente di regressione nel modello.
È possibile utilizzare una sintassi simile per accedere a qualsiasi valore nell’output.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R
Come eseguire la regressione logistica in R
Come eseguire la regressione quadratica in R