R'deki regresyon çizgisinin eğimi için t testi nasıl yapılır?
Basit bir doğrusal regresyon gerçekleştiririz ve aşağıdaki tahmini regresyon denklemini elde ederiz:
ŷ = b 0 + b 1 x
Genellikle eğim katsayısı b 1’in istatistiksel olarak anlamlı olup olmadığını bilmek isteriz.
b1’in istatistiksel olarak anlamlı olup olmadığını belirlemek için aşağıdaki test istatistiğiyle bir t-testi yapabiliriz:
t = b 1 / se(b 1 )
Altın:
- se(b 1 ), b 1’in standart hatasını temsil eder.
Daha sonra bu test istatistiğine karşılık gelen p değerini n-2 serbestlik derecesiyle hesaplayabiliriz.
Eğer p değeri belli bir eşikten küçükse (örneğin α = 0,05), eğim katsayısının sıfır olmadığı sonucuna varabiliriz.
Başka bir deyişle, yordayıcı değişken ile modeldeki yanıt değişkeni arasında istatistiksel olarak anlamlı bir ilişki vardır.
Aşağıdaki örnek, R’deki bir regresyon çizgisinin eğimi için t testinin nasıl gerçekleştirileceğini gösterir.
Örnek: R’deki regresyon çizgisinin eğimi için bir t testi çalıştırma
R’de, bir sınıftaki 12 öğrencinin aldığı ders saatleri ve final sınav puanları hakkında bilgi içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#create data frame df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8), score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82)) #view data frame df hours score 1 1 65 2 1 67 3 2 78 4 2 75 5 3 73 6 4 84 7 5 80 8 5 76 9 5 89 10 6 91 11 6 83 12 8 82
Çalışılan saatlerle sınav puanları arasında istatistiksel olarak anlamlı bir ilişki olup olmadığını belirlemek için basit bir doğrusal regresyon modeli uygulamak istediğimizi varsayalım.
Bu regresyon modeline uymak için R’deki lm() fonksiyonunu kullanabiliriz:
#fit simple linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -7,398 -3,926 -1,139 4,972 7,713 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 67.7685 3.3757 20.075 2.07e-09 *** hours 2.7037 0.7456 3.626 0.00464 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.479 on 10 degrees of freedom Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641
Model sonuçlarından tahmin edilen regresyon denkleminin şu şekilde olduğunu görebiliriz:
Sınav puanı = 67,7685 + 2,7037 (saat)
Eğim katsayısının istatistiksel olarak anlamlı olup olmadığını test etmek için t-testi istatistiğini aşağıdaki şekilde hesaplayabiliriz:
- t = b 1 / se(b 1 )
- t = 2,7037 / 0,7456
- t = 3,626
Bu t-testi istatistiğine karşılık gelen p değeri, çıktıda Pr(> |t|) adı verilen sütunda görüntülenir.
P değeri 0,00464 olarak çıkıyor.
Bu p değeri 0,05’ten küçük olduğundan eğim katsayısının istatistiksel olarak anlamlı olduğu sonucuna varıyoruz.
Yani öğrencinin ders saati sayısı ile öğrencinin sınavda aldığı final notu arasında istatistiksel olarak anlamlı bir ilişki vardır.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’de basit doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
R’de regresyon çıktısı nasıl yorumlanır