R'deki regresyon çizgisinin eğimi için t testi nasıl yapılır?


Basit bir doğrusal regresyon gerçekleştiririz ve aşağıdaki tahmini regresyon denklemini elde ederiz:

ŷ = b 0 + b 1 x

Genellikle eğim katsayısı b 1’in istatistiksel olarak anlamlı olup olmadığını bilmek isteriz.

b1’in istatistiksel olarak anlamlı olup olmadığını belirlemek için aşağıdaki test istatistiğiyle bir t-testi yapabiliriz:

t = b 1 / se(b 1 )

Altın:

  • se(b 1 ), b 1’in standart hatasını temsil eder.

Daha sonra bu test istatistiğine karşılık gelen p değerini n-2 serbestlik derecesiyle hesaplayabiliriz.

Eğer p değeri belli bir eşikten küçükse (örneğin α = 0,05), eğim katsayısının sıfır olmadığı sonucuna varabiliriz.

Başka bir deyişle, yordayıcı değişken ile modeldeki yanıt değişkeni arasında istatistiksel olarak anlamlı bir ilişki vardır.

Aşağıdaki örnek, R’deki bir regresyon çizgisinin eğimi için t testinin nasıl gerçekleştirileceğini gösterir.

Örnek: R’deki regresyon çizgisinin eğimi için bir t testi çalıştırma

R’de, bir sınıftaki 12 öğrencinin aldığı ders saatleri ve final sınav puanları hakkında bilgi içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8),
                 score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82))

#view data frame
df

   hours score
1 1 65
2 1 67
3 2 78
4 2 75
5 3 73
6 4 84
7 5 80
8 5 76
9 5 89
10 6 91
11 6 83
12 8 82

Çalışılan saatlerle sınav puanları arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını belirlemek için basit bir doğrusal regresyon modeli uygulamak istediğimizi varsayalım.

Bu regresyon modeline uymak için R’deki lm() fonksiyonunu kullanabiliriz:

 #fit simple linear regression model
fit <- lm(score ~ hours, data=df)

#view model summary
summary(fit)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
   Min 1Q Median 3Q Max 
-7,398 -3,926 -1,139 4,972 7,713 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 67.7685 3.3757 20.075 2.07e-09 ***
hours 2.7037 0.7456 3.626 0.00464 ** 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.479 on 10 degrees of freedom
Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 
F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641

Model sonuçlarından tahmin edilen regresyon denkleminin şu şekilde olduğunu görebiliriz:

Sınav puanı = 67,7685 + 2,7037 (saat)

Eğim katsayısının istatistiksel olarak anlamlı olup olmadığını test etmek için t-testi istatistiğini aşağıdaki şekilde hesaplayabiliriz:

  • t = b 1 / se(b 1 )
  • t = 2,7037 / 0,7456
  • t = 3,626

Bu t-testi istatistiğine karşılık gelen p değeri, çıktıda Pr(> |t|) adı verilen sütunda görüntülenir.

P değeri 0,00464 olarak çıkıyor.

Bu p değeri 0,05’ten küçük olduğundan eğim katsayısının istatistiksel olarak anlamlı olduğu sonucuna varıyoruz.

Yani öğrencinin ders saati sayısı ile öğrencinin sınavda aldığı final notu arasında istatistiksel olarak anlamlı bir ilişki vardır.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de basit doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
R’de regresyon çıktısı nasıl yorumlanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir