R'de regresyon modeli çıktısında pr(>|t|) nasıl yorumlanır?


R’de doğrusal bir regresyon gerçekleştirdiğinizde, regresyon modelinizin çıktısı aşağıdaki formatta görüntülenecektir:

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732 

Pr(>|t|) sütunu, t değeri sütunundaki değerle ilişkili p değerini temsil eder.

P değeri belirli bir anlamlılık düzeyinin altındaysa (örneğin α = 0,05), yordayıcı değişkenin modeldeki yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişkiye sahip olduğu kabul edilir.

Aşağıdaki örnek, belirli bir regresyon modeli için Pr(>|t|) sütunundaki değerlerin nasıl yorumlanacağını gösterir.

Örnek: Pr(>|t|) değerleri nasıl yorumlanır?

Tahmin edici değişkenler x1 ve x2’yi ve tek bir yanıt değişkeni y’yi kullanarak çoklu doğrusal regresyon modeline uymak istediğimizi varsayalım.

Aşağıdaki kod, bir veri çerçevesinin nasıl oluşturulacağını ve verilere bir regresyon modelinin nasıl sığdırılacağını gösterir:

 #create data frame
df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6),
                 x2=c(7, 7, 5, 6, 5, 4, 5, 6),
                 y=c(8, 8, 9, 9, 13, 14, 17, 14))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#view model summary
summary(model)

Call:
lm(formula = y ~ x1 + x2, data = df)

Residuals:
      1 2 3 4 5 6 7 8 
 2.0046 -0.9470 -1.5138 -2.2062 1.0104 -0.2488 2.0588 -0.1578 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.0035 5.9091 1.693 0.1513  
x1 1.4758 0.5029 2.935 0.0325 *
x2 -0.7834 0.8014 -0.978 0.3732  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.867 on 5 degrees of freedom
Multiple R-squared: 0.7876, Adjusted R-squared: 0.7026 
F-statistic: 9.268 on 2 and 5 DF, p-value: 0.0208

Pr(>|t|) sütunundaki değerleri şu şekilde yorumlayabilirsiniz:

  • Tahmin değişkeni x1’in p değeri 0,0325’tir . Bu değer 0,05’ten küçük olduğundan modeldeki yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişki vardır.
  • Tahmin değişkeni x2’nin p değeri 0,3732’dir . Bu değer 0,05’ten küçük olmadığından modeldeki yanıt değişkeni ile istatistiksel olarak anlamlı bir ilişkiye sahip değildir.

Katsayı tablosunun altındaki anlamlılık kodları bize, 0,0325 p değerinin yanındaki tek yıldız işaretinin (*), p değerinin α = 0,05’te istatistiksel olarak anlamlı olduğu anlamına geldiğini söyler.

Pr(>|t|) gerçekte nasıl hesaplanır?

Pr(>|t|) değerinin gerçekte nasıl hesaplandığı aşağıda açıklanmıştır:

Adım 1: t değerini hesaplayın

Öncelikle aşağıdaki formülü kullanarak t değerini hesaplıyoruz:

  • t-değeri = Tahmin / Std. Hata

Örneğin, tahmin değişkeni x1 için t değerinin nasıl hesaplanacağı aşağıda açıklanmıştır:

 #calculate t-value
1.4758 / .5029

[1] 2.934579

Adım 2: P değerini hesaplayın

Daha sonra p-değerini hesaplıyoruz. Bu, t dağılımının mutlak değerinin 2,935’ten büyük olma olasılığını temsil eder.

Bu değeri hesaplamak için R’de aşağıdaki formülü kullanabiliriz:

  • p-değeri = 2 * pt (abs (t-değeri), artık df, alt.kuyruk = YANLIŞ)

Örneğin, 5 artık serbestlik derecesi ile 2,935’lik bir t değeri için p değerinin nasıl hesaplanacağı aşağıda açıklanmıştır:

 #calculate p-value
2 * pt( abs (2.935), 5, lower. tail = FALSE )

[1] 0.0324441

Bu p değerinin yukarıdaki regresyon çıktısındaki p değeriyle eşleştiğini unutmayın.

Not: Artık serbestlik derecelerinin değeri regresyon çıktısının altındadır. Örneğimizde 5 olduğu ortaya çıktı:

 Residual standard error: 1.867 on 5 degrees of freedom

Ek kaynaklar

R’de basit doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon sonuçları nasıl çizilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir