Bagaimana menafsirkan pr(>|z|) dalam keluaran regresi logistik di r


Setiap kali Anda melakukan regresi logistik di R, keluaran model regresi Anda akan ditampilkan dalam format berikut:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

Kolom Pr(>|z|) mewakili nilai p yang terkait dengan nilai pada kolom nilai z .

Jika p-value berada di bawah tingkat signifikansi tertentu (misalnya α = 0,05), hal ini menunjukkan bahwa variabel prediktor mempunyai hubungan yang signifikan secara statistik dengan variabel respon dalam model.

Contoh berikut menunjukkan cara menafsirkan nilai kolom Pr(>|z|) untuk model regresi logistik dalam praktiknya.

Contoh: Cara menginterpretasikan nilai Pr(>|z|).

Kode berikut menunjukkan cara menyesuaikan model regresi logistik di R menggunakan set data mtcars bawaan:

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Berikut cara menginterpretasikan nilai pada kolom Pr(>|z|):

  • Nilai p untuk variabel prediktor “disp” adalah 0,5305 . Karena nilai ini tidak kurang dari 0,05, maka tidak mempunyai hubungan yang signifikan secara statistik dengan variabel respon dalam model.
  • Nilai p untuk variabel prediktor “drat” adalah 0,0315 . Karena nilai ini kurang dari 0,05, maka terdapat hubungan yang signifikan secara statistik dengan variabel respon dalam model.

Kode signifikansi di bawah tabel koefisien menunjukkan bahwa satu tanda bintang (*) di sebelah nilai p sebesar 0,0315 berarti nilai p signifikan secara statistik pada α = 0,05.

Bagaimana Pr(>|z|) dihitung?

Berikut adalah cara sebenarnya menghitung nilai Pr(>|z|):

Langkah 1: Hitung nilai z

Pertama, kita hitung nilai z menggunakan rumus berikut:

  • nilai z = Perkiraan / Std. Kesalahan

Sebagai contoh, berikut cara menghitung nilai z untuk variabel prediktor “drat”:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Langkah 2: Hitung nilai p

Selanjutnya, kita menghitung nilai p dua sisi. Hal ini menunjukkan probabilitas bahwa nilai absolut dari distribusi normal lebih besar dari 2,151 atau kurang dari -2,151.

Kita dapat menggunakan rumus berikut di R untuk menghitung nilai ini:

  • nilai-p = 2 * (1-pnorm(nilai-z))

Misalnya, berikut cara menghitung nilai p dua sisi untuk nilai z 2,151:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Perhatikan bahwa nilai p ini cocok dengan nilai p pada keluaran regresi di atas.

Sumber daya tambahan

Tutorial berikut menjelaskan cara menyesuaikan model regresi yang berbeda di R:

Bagaimana melakukan regresi logistik di R
Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *