Cara melakukan uji-t untuk kemiringan garis regresi di r
Kami melakukan regresi linier sederhana , kami mendapatkan perkiraan persamaan regresi berikut:
ŷ = b 0 + b 1 x
Umumnya kita ingin mengetahui apakah koefisien kemiringan, b 1 , signifikan secara statistik.
Untuk menentukan apakah b 1 signifikan secara statistik, kita dapat melakukan uji-t dengan statistik uji sebagai berikut:
t = b 1 / se(b 1 )
Emas:
- se(b 1 ) mewakili kesalahan standar b 1 .
Kami kemudian dapat menghitung nilai p yang sesuai dengan statistik pengujian ini dengan n-2 derajat kebebasan.
Jika p-value kurang dari ambang batas tertentu (misalnya α = 0,05), maka kita dapat menyimpulkan bahwa koefisien kemiringannya bukan nol.
Dengan kata lain, terdapat hubungan yang signifikan secara statistik antara variabel prediktor dan variabel respon dalam model.
Contoh berikut menunjukkan cara melakukan uji-t untuk kemiringan garis regresi di R.
Contoh: Menjalankan uji-t untuk kemiringan garis regresi di R
Misalkan kita memiliki kerangka data berikut di R yang berisi informasi tentang jam belajar dan nilai ujian akhir yang dicapai oleh 12 siswa dalam satu kelas:
#create data frame df <- data. frame (hours=c(1, 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 8), score=c(65, 67, 78, 75, 73, 84, 80, 76, 89, 91, 83, 82)) #view data frame df hours score 1 1 65 2 1 67 3 2 78 4 2 75 5 3 73 6 4 84 7 5 80 8 5 76 9 5 89 10 6 91 11 6 83 12 8 82
Katakanlah kita ingin menyesuaikan model regresi linier sederhana untuk menentukan apakah ada hubungan yang signifikan secara statistik antara jam belajar dan nilai ujian.
Kita dapat menggunakan fungsi lm() di R agar sesuai dengan model regresi ini:
#fit simple linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -7,398 -3,926 -1,139 4,972 7,713 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 67.7685 3.3757 20.075 2.07e-09 *** hours 2.7037 0.7456 3.626 0.00464 ** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.479 on 10 degrees of freedom Multiple R-squared: 0.568, Adjusted R-squared: 0.5248 F-statistic: 13.15 on 1 and 10 DF, p-value: 0.004641
Dari hasil model terlihat bahwa persamaan regresi yang diestimasi adalah:
Nilai ujian = 67.7685 + 2.7037 (jam)
Untuk menguji apakah koefisien kemiringan signifikan secara statistik, kita dapat menghitung statistik uji-t sebagai berikut:
- t = b 1 / se(b 1 )
- t = 2,7037 / 0,7456
- t = 3,626
Nilai p yang sesuai dengan statistik uji-t ini ditampilkan di kolom bernama Pr(> |t|) pada output.
Nilai pnya ternyata 0,00464 .
Karena nilai p ini kurang dari 0,05, kami menyimpulkan bahwa koefisien kemiringan signifikan secara statistik.
Dengan kata lain, terdapat hubungan yang signifikan secara statistik antara jumlah jam belajar dan nilai akhir yang diterima siswa dalam ujian.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:
Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R
Bagaimana menafsirkan keluaran regresi di R