R'de lojistik regresyon çıktısında pr(>|z|) nasıl yorumlanır?


R’de lojistik regresyon gerçekleştirdiğinizde, regresyon modelinizin çıktısı aşağıdaki formatta görüntülenecektir:

 Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 * 

Pr(>|z|) sütunu, z değeri sütunundaki değerle ilişkili p değerini temsil eder.

P değerinin belirli bir anlamlılık düzeyinin altında olması (örneğin α = 0,05), yordayıcı değişkenin modeldeki yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişkiye sahip olduğunu gösterir.

Aşağıdaki örnek, pratikte lojistik regresyon modeli için Pr(>|z|) sütununun değerlerinin nasıl yorumlanacağını göstermektedir.

Örnek: Pr(>|z|) değerleri nasıl yorumlanır?

Aşağıdaki kod, yerleşik mtcars veri kümesini kullanarak R’ye bir lojistik regresyon modelinin nasıl sığdırılacağını gösterir:

 #fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.5773 -0.2273 -0.1155 0.5196 1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452 9.165482 -1.924 0.0543 .
available -0.004153 0.006621 -0.627 0.5305  
drat 4.879396 2.268115 2.151 0.0315 *
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 21,268 on 29 degrees of freedom
AIC: 27,268

Number of Fisher Scoring iterations: 6

Pr(>|z|) sütunundaki değerleri şu şekilde yorumlayabilirsiniz:

  • Tahmin değişkeni “disp” için p değeri 0,5305’tir . Bu değer 0,05’ten küçük olmadığından modeldeki yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişkiye sahip değildir.
  • Tahmin değişkeni “drat” için p değeri 0,0315’tir . Bu değer 0,05’ten küçük olduğundan modeldeki yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişki vardır.

Katsayı tablosunun altındaki anlamlılık kodları bize, 0,0315 p değerinin yanındaki tek yıldız işaretinin (*), p değerinin α = 0,05’te istatistiksel olarak anlamlı olduğu anlamına geldiğini söyler.

Pr(>|z|) nasıl hesaplanır?

Pr(>|z|) değerinin aslında nasıl hesaplandığı aşağıda açıklanmıştır:

Adım 1: Z değerini hesaplayın

İlk olarak z değerini aşağıdaki formülü kullanarak hesaplıyoruz:

  • z değeri = Tahmin / Std. Hata

Örneğin, tahmin değişkeni “drat” için z değerinin nasıl hesaplanacağı aşağıda açıklanmıştır:

 #calculate z-value
4.879396 / 2.268115

[1] 2.151

Adım 2: P değerini hesaplayın

Daha sonra iki kuyruklu p değerini hesaplıyoruz. Bu, normal dağılımın mutlak değerinin 2,151’den büyük veya -2,151’den küçük olma olasılığını temsil eder.

Bu değeri hesaplamak için R’de aşağıdaki formülü kullanabiliriz:

  • p-değeri = 2 * (1-pnorm(z-değeri))

Örneğin, 2,151 z değeri için iki kuyruklu p değerinin nasıl hesaplanacağı aşağıda açıklanmıştır:

 #calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

Bu p değerinin yukarıdaki regresyon çıktısındaki p değeriyle eşleştiğini unutmayın.

Ek kaynaklar

Aşağıdaki eğitimlerde R’ye farklı regresyon modellerinin nasıl sığdırılacağı açıklanmaktadır:

R’de lojistik regresyon nasıl gerçekleştirilir
R’de basit doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir