Bagaimana menafsirkan pr(>|z|) dalam keluaran regresi logistik di r
Setiap kali Anda melakukan regresi logistik di R, keluaran model regresi Anda akan ditampilkan dalam format berikut:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305
drat 4.879396 2.268115 2.151 0.0315 *
Kolom Pr(>|z|) mewakili nilai p yang terkait dengan nilai pada kolom nilai z .
Jika p-value berada di bawah tingkat signifikansi tertentu (misalnya α = 0,05), hal ini menunjukkan bahwa variabel prediktor mempunyai hubungan yang signifikan secara statistik dengan variabel respon dalam model.
Contoh berikut menunjukkan cara menafsirkan nilai kolom Pr(>|z|) untuk model regresi logistik dalam praktiknya.
Contoh: Cara menginterpretasikan nilai Pr(>|z|).
Kode berikut menunjukkan cara menyesuaikan model regresi logistik di R menggunakan set data mtcars bawaan:
#fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)
#view model summary
summary(model)
Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.5773 -0.2273 -0.1155 0.5196 1.8957
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268
Number of Fisher Scoring iterations: 6
Berikut cara menginterpretasikan nilai pada kolom Pr(>|z|):
- Nilai p untuk variabel prediktor “disp” adalah 0,5305 . Karena nilai ini tidak kurang dari 0,05, maka tidak mempunyai hubungan yang signifikan secara statistik dengan variabel respon dalam model.
- Nilai p untuk variabel prediktor “drat” adalah 0,0315 . Karena nilai ini kurang dari 0,05, maka terdapat hubungan yang signifikan secara statistik dengan variabel respon dalam model.
Kode signifikansi di bawah tabel koefisien menunjukkan bahwa satu tanda bintang (*) di sebelah nilai p sebesar 0,0315 berarti nilai p signifikan secara statistik pada α = 0,05.
Bagaimana Pr(>|z|) dihitung?
Berikut adalah cara sebenarnya menghitung nilai Pr(>|z|):
Langkah 1: Hitung nilai z
Pertama, kita hitung nilai z menggunakan rumus berikut:
- nilai z = Perkiraan / Std. Kesalahan
Sebagai contoh, berikut cara menghitung nilai z untuk variabel prediktor “drat”:
#calculate z-value 4.879396 / 2.268115 [1] 2.151
Langkah 2: Hitung nilai p
Selanjutnya, kita menghitung nilai p dua sisi. Hal ini menunjukkan probabilitas bahwa nilai absolut dari distribusi normal lebih besar dari 2,151 atau kurang dari -2,151.
Kita dapat menggunakan rumus berikut di R untuk menghitung nilai ini:
- nilai-p = 2 * (1-pnorm(nilai-z))
Misalnya, berikut cara menghitung nilai p dua sisi untuk nilai z 2,151:
#calculate p-value
2*(1-pnorm(2.151))
[1] 0.0314762
Perhatikan bahwa nilai p ini cocok dengan nilai p pada keluaran regresi di atas.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menyesuaikan model regresi yang berbeda di R:
Bagaimana melakukan regresi logistik di R
Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R