R'de regresyon katsayısı için güven aralığı nasıl hesaplanır


Doğrusal bir regresyon modelinde, bir regresyon katsayısı bize yordayıcı değişkendeki bir birimlik artışla ilişkili yanıt değişkenindeki ortalama değişikliği anlatır.

Bir regresyon katsayısına ilişkin güven aralığını hesaplamak için aşağıdaki formülü kullanabiliriz:

β 1 için güven aralığı : b 1 ± t 1-α/2, n-2 * se(b 1 )

Altın:

  •   b 1 = Regresyon tablosunda gösterilen regresyon katsayısı
  • t 1-∝/2, n-2 = n-2 serbestlik derecesine sahip 1-∝ güven düzeyi için kritik t değeri; burada n , veri setimizdeki toplam gözlem sayısıdır
  • se(b 1 ) = Regresyon tablosunda gösterilen b 1’in standart hatası

Aşağıdaki örnek, pratikte bir regresyon eğimi için güven aralığının nasıl hesaplanacağını gösterir.

Örnek: R’deki regresyon katsayısı için güven aralığı

Belirli bir sınıftaki 15 öğrenci için yordayıcı değişken olarak çalışılan saatleri ve yanıt değişkeni olarak sınav puanlarını kullanarak basit bir doğrusal regresyon modeli uydurmak istediğimizi varsayalım:

Bu basit doğrusal regresyon modelini R’ye sığdırmak için lm() işlevini kullanabiliriz:

 #create data frame
df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14),
                 score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89))

#fit linear regression model
fit <- lm(score ~ hours, data=df)

#view model summary
summary(fit)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
   Min 1Q Median 3Q Max 
-5,140 -3,219 -1,193 2,816 5,772 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 65,334 2,106 31,023 1.41e-13 ***
hours 1.982 0.248 7.995 2.25e-06 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.641 on 13 degrees of freedom
Multiple R-squared: 0.831, Adjusted R-squared: 0.818 
F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06

Sonuçtaki katsayı tahminlerini kullanarak uydurulan basit doğrusal regresyon modelini şu şekilde yazabiliriz:

Puan = 65.334 + 1.982*(Çalışma saati)

Saatlere ilişkin regresyon katsayısının 1,982 olduğunu unutmayın.

Bu bize, harcanan her ek çalışma saatinin sınav puanında ortalama 1.982 puanlık bir artışla ilişkili olduğunu söylüyor.

Regresyon katsayısı için %95’lik bir güven aralığı hesaplamak amacıylaconcont () işlevini kullanabiliriz:

 #calculate confidence interval for regression coefficient for 'hours'
confint(fit, ' hours ', level= 0.95 )

         2.5% 97.5%
hours 1.446682 2.518068

Regresyon katsayısı için %95 güven aralığı [1,446, 2,518]’ dir.

Bu güven aralığı 0 değerini içermediğinden çalışılan saat ile sınav notu arasında istatistiksel olarak anlamlı bir ilişkinin olduğu sonucuna varabiliriz.

Regresyon katsayısı için %95 güven aralığını manuel olarak hesaplayarak da bunun doğru olduğunu doğrulayabiliriz:

  • β 1 için %95 GA: b 1 ± t 1-α/2, n-2 * se(b 1 )
  • β 1 için %95 GA: 1,982 ± t 0,975, 15-2 * 0,248
  • β 1 için %95 GA: 1,982 ± 2,1604 * 0,248
  • β 1 için %95 GA: [1,446, 2,518]

Regresyon katsayısı için %95 güven aralığı [1,446, 2,518]’ dir.

Not #1 : 13 serbestlik derecesine sahip %95 güven seviyesine karşılık gelen kritik t değerini bulmak için ters t dağılımı hesaplayıcısını kullandık.

Not #2 : Farklı bir güven düzeyine sahip bir güven aralığı hesaplamak için, concontin() işlevindeki düzey bağımsız değişkeninin değerini değiştirmeniz yeterlidir.

Ek kaynaklar

Aşağıdaki eğitimler R’deki doğrusal regresyon hakkında ek bilgi sağlar:

R’de regresyon çıktısı nasıl yorumlanır
R’de basit doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
R’de lojistik regresyon nasıl gerçekleştirilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir