Cara menghitung interval kepercayaan untuk intersep regresi
Regresi linier sederhana digunakan untuk mengukur hubungan antara variabel prediktor dan variabel respon.
Metode ini menemukan baris yang paling “cocok” dengan sekumpulan data dan mengambil bentuk berikut:
ŷ = b 0 + b 1 x
Emas:
- ŷ : Perkiraan nilai respons
- b 0 : Asal garis regresi
- b 1 : Kemiringan garis regresi
- x : Nilai variabel prediktif
Kita sering kali tertarik pada nilai b 1 , yang menunjukkan perubahan rata-rata pada variabel respons yang dikaitkan dengan peningkatan satu unit pada variabel prediktor.
Namun, dalam keadaan yang jarang terjadi, kita juga tertarik pada nilai b0 , yang memberi tahu kita nilai rata-rata variabel respons ketika variabel prediktornya nol.
Kita dapat menggunakan rumus berikut untuk menghitung selang kepercayaan untuk nilai β 0 , konstanta populasi sebenarnya:
Interval kepercayaan untuk β 0 : b 0 ± t α/2, n-2 * se(b 0 )
Contoh berikut menunjukkan cara menghitung interval kepercayaan untuk intersep dalam praktiknya.
Contoh: Interval Keyakinan untuk Intersepsi Regresi
Misalkan kita ingin menyesuaikan model regresi linier sederhana dengan menggunakan jam belajar sebagai variabel prediktor dan nilai ujian sebagai variabel respon untuk 15 siswa di kelas tertentu:

Kode berikut menunjukkan cara menyesuaikan model regresi linier sederhana ini di R:
#create data frame df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14), score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89)) #fit simple linear regression model fit <- lm(score ~ hours, data=df) #view summary of model summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -5,140 -3,219 -1,193 2,816 5,772 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 65,334 2,106 31,023 1.41e-13 *** hours 1.982 0.248 7.995 2.25e-06 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.641 on 13 degrees of freedom Multiple R-squared: 0.831, Adjusted R-squared: 0.818 F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06
Dengan menggunakan estimasi koefisien pada hasil, kita dapat menulis model regresi linier sederhana sebagai berikut:
Skor = 65.334 + 1.982*(Jam belajar)
Nilai intersepnya adalah 65.334. Hal ini menunjukkan bahwa perkiraan nilai ujian rata-rata untuk siswa yang belajar selama nol jam adalah 65,334 .
Kita dapat menggunakan rumus berikut untuk menghitung interval kepercayaan 95% untuk intersep:
- 95% CI untuk β 0 : b 0 ± t α/2, n-2 * se(b 0 )
- CI 95% untuk β 0 : 65,334 ± t 0,05/2,15-2 * 2,106
- CI 95% untuk β 0 : 65,334 ± 2,1604 * 2,106
- 95% CI untuk β 0 : [60.78, 69.88]
Kami menafsirkan ini berarti bahwa kami yakin 95% bahwa nilai ujian rata-rata sebenarnya dari siswa yang belajar selama nol jam adalah antara 60,78 dan 69,88.
Catatan : Kami menggunakan kalkulator distribusi t terbalik untuk mencari nilai t kritis yang sesuai dengan tingkat kepercayaan 95% dengan 13 derajat kebebasan.
Tindakan pencegahan untuk menghitung interval kepercayaan untuk intersep regresi
Dalam praktiknya, kita sering tidak menghitung interval kepercayaan untuk intersep regresi, karena biasanya tidak masuk akal untuk menginterpretasikan nilai intersep dalam model regresi.
Misalnya, kita memasang model regresi yang menggunakan tinggi badan pemain bola basket sebagai variabel prediktor dan rata-rata poin per pertandingan sebagai variabel respons.
Tidak mungkin seorang pemain memiliki tinggi nol kaki, jadi tidak masuk akal untuk menafsirkan intersepsi secara harfiah dalam model ini.
Ada banyak sekali skenario seperti ini di mana variabel prediktor tidak dapat mengambil nilai nol. Jadi tidak masuk akal untuk menafsirkan nilai asli model atau membuat interval kepercayaan untuk titik asal.
Misalnya, pertimbangkan variabel prediktor potensial berikut dalam suatu model:
- Luas sebuah rumah
- Panjang mobil
- Berat badan seseorang
Masing-masing variabel prediktor tersebut tidak boleh bernilai nol. Oleh karena itu, tidak masuk akal untuk menghitung interval kepercayaan asal usul model regresi dalam kondisi seperti ini.
Sumber daya tambahan
Tutorial berikut memberikan informasi tambahan tentang regresi linier:
Pengantar Regresi Linier Sederhana
Pengantar Regresi Linier Berganda
Cara Membaca dan Menafsirkan Tabel Regresi
Cara melaporkan hasil regresi