Cara menghitung interval kepercayaan untuk koefisien regresi di r


Dalam model regresi linier, koefisien regresi menunjukkan rata-rata perubahan variabel respons yang terkait dengan peningkatan satu unit variabel prediktor.

Kita dapat menggunakan rumus berikut untuk menghitung interval kepercayaan koefisien regresi:

Interval kepercayaan untuk β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

Emas:

  •   b 1 = Koefisien regresi ditunjukkan pada tabel regresi
  • t 1-∝/2, n-2 = Nilai t kritis untuk tingkat kepercayaan 1-∝ dengan n-2 derajat kebebasan di mana n adalah jumlah total observasi dalam kumpulan data kami
  • se(b 1 ) = Kesalahan standar b 1 yang ditunjukkan pada tabel regresi

Contoh berikut menunjukkan cara menghitung interval kepercayaan untuk kemiringan regresi dalam praktiknya.

Contoh: Interval kepercayaan untuk koefisien regresi dalam R

Misalkan kita ingin menyesuaikan model regresi linier sederhana dengan menggunakan jam belajar sebagai variabel prediktor dan nilai ujian sebagai variabel respon untuk 15 siswa di kelas tertentu:

Kita dapat menggunakan fungsi lm() untuk menyesuaikan model regresi linier sederhana ini di R:

 #create data frame
df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14),
                 score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89))

#fit linear regression model
fit <- lm(score ~ hours, data=df)

#view model summary
summary(fit)

Call:
lm(formula = score ~ hours, data = df)

Residuals:
   Min 1Q Median 3Q Max 
-5,140 -3,219 -1,193 2,816 5,772 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 65,334 2,106 31,023 1.41e-13 ***
hours 1.982 0.248 7.995 2.25e-06 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.641 on 13 degrees of freedom
Multiple R-squared: 0.831, Adjusted R-squared: 0.818 
F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06

Dengan menggunakan estimasi koefisien pada hasil, kita dapat menulis model regresi linier sederhana sebagai berikut:

Skor = 65.334 + 1.982*(Jam belajar)

Perhatikan bahwa koefisien regresi jam adalah 1,982 .

Hal ini menunjukkan bahwa setiap tambahan jam waktu belajar yang dihabiskan dikaitkan dengan peningkatan rata-rata nilai ujian sebesar 1.982 .

Kita dapat menggunakan fungsi confint() untuk menghitung interval kepercayaan 95% untuk koefisien regresi:

 #calculate confidence interval for regression coefficient for 'hours'
confint(fit, ' hours ', level= 0.95 )

         2.5% 97.5%
hours 1.446682 2.518068

Interval kepercayaan 95% untuk koefisien regresi adalah [1.446, 2.518] .

Karena interval kepercayaan ini tidak mengandung nilai 0, kita dapat menyimpulkan bahwa terdapat hubungan yang signifikan secara statistik antara jam belajar dan nilai ujian.

Kami juga dapat memastikan kebenarannya dengan menghitung secara manual interval kepercayaan 95% untuk koefisien regresi:

  • 95% CI untuk β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • CI 95% untuk β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • CI 95% untuk β 1 : 1,982 ± 2,1604 * 0,248
  • 95% CI untuk β 1 : [1.446, 2.518]

Interval kepercayaan 95% untuk koefisien regresi adalah [1.446, 2.518] .

Catatan #1 : Kami menggunakan kalkulator distribusi t terbalik untuk mencari nilai t kritis yang sesuai dengan tingkat kepercayaan 95% dengan 13 derajat kebebasan.

Catatan #2 : Untuk menghitung interval kepercayaan dengan tingkat kepercayaan yang berbeda, cukup ubah nilai argumen level di fungsi confint() .

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang regresi linier di R:

Bagaimana menafsirkan keluaran regresi di R
Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R
Bagaimana melakukan regresi logistik di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *