Cara menghitung nilai p dari statistik f di r
Uji F menghasilkan statistik F. Untuk menemukan nilai p yang terkait dengan statistik F di R, Anda dapat menggunakan perintah berikut:
pf(fstat, df1, df2, lebih rendah.ekor = SALAH)
- fstat – nilai statistik f
- df1 – derajat kebebasan 1
- df2 – derajat kebebasan 2
- lower.tail – apakah akan mengembalikan probabilitas yang terkait dengan bagian bawah distribusi F atau tidak. Ini BENAR secara default.
Misalnya, berikut cara mencari nilai p yang terkait dengan statistik F 5, dengan derajat kebebasan 1 = 3 dan derajat kebebasan 2 = 14:
pf(5, 3, 14, lower.tail = FALSE) #[1] 0.01457807
Salah satu kegunaan uji F yang paling umum adalah untuk menguji signifikansi model regresi secara keseluruhan . Pada contoh berikut, kami menunjukkan cara menghitung nilai p dari statistik F untuk model regresi.
Contoh: Menghitung nilai p dari statistik F
Katakanlah kita memiliki kumpulan data yang menunjukkan jumlah jam belajar, jumlah ujian persiapan yang diambil, dan nilai ujian akhir untuk 12 siswa berbeda:
#create dataset data <- data.frame(study_hours = c(3, 7, 16, 14, 12, 7, 4, 19, 4, 8, 8, 3), prep_exams = c(2, 6, 5, 2, 7, 4, 4, 2, 8, 4, 1, 3), final_score = c(76, 88, 96, 90, 98, 80, 86, 89, 68, 75, 72, 76)) #view first six rows of dataset head(data) # study_hours prep_exams final_score #1 3 2 76 #2 7 6 88 #3 16 5 96 #4 14 2 90 #5 12 7 98 #6 7 4 80
Kemudian kita dapat menyesuaikan model regresi linier dengan data tersebut dengan menggunakan jam belajar dan persiapan ujian sebagai variabel prediktor dan nilai akhir sebagai variabel respon. Kemudian kita dapat memvisualisasikan hasil modelnya:
#fit regression model model <- lm(final_score ~ study_hours + prep_exams, data = data) #view output of the model summary(model) #Call: #lm(formula = final_score ~ study_hours + prep_exams, data = data) # #Residuals: # Min 1Q Median 3Q Max #-13,128 -5,319 2,168 3,458 9,341 # #Coefficients: #Estimate Std. Error t value Pr(>|t|) #(Intercept) 66,990 6,211 10,785 1.9e-06 *** #study_hours 1.300 0.417 3.117 0.0124 * #prep_exams 1.117 1.025 1.090 0.3041 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 # #Residual standard error: 7.327 on 9 degrees of freedom #Multiple R-squared: 0.5308, Adjusted R-squared: 0.4265 #F-statistic: 5.091 on 2 and 9 DF, p-value: 0.0332
Pada baris terakhir hasil, kita dapat melihat bahwa statistik F untuk model regresi keseluruhan adalah 5.091 . Statistik F ini mempunyai 2 derajat kebebasan untuk pembilangnya dan 9 derajat kebebasan untuk penyebutnya. R secara otomatis menghitung bahwa nilai p untuk statistik F ini adalah 0,0332 .
Untuk menghitung sendiri nilai p yang setara ini, kita dapat menggunakan kode berikut:
pf(5.091, 2, 9, lower.tail = FALSE) #[1] 0.0331947
Perhatikan bahwa kita mendapatkan jawaban yang sama (tetapi dengan lebih banyak angka desimal yang ditampilkan) seperti keluaran regresi linier di atas.