Cara menghitung nilai p dari statistik f di r


Uji F menghasilkan statistik F. Untuk menemukan nilai p yang terkait dengan statistik F di R, Anda dapat menggunakan perintah berikut:

pf(fstat, df1, df2, lebih rendah.ekor = SALAH)

  • fstat – nilai statistik f
  • df1 – derajat kebebasan 1
  • df2 – derajat kebebasan 2
  • lower.tail – apakah akan mengembalikan probabilitas yang terkait dengan bagian bawah distribusi F atau tidak. Ini BENAR secara default.

Misalnya, berikut cara mencari nilai p yang terkait dengan statistik F 5, dengan derajat kebebasan 1 = 3 dan derajat kebebasan 2 = 14:

 pf(5, 3, 14, lower.tail = FALSE)

#[1] 0.01457807

Salah satu kegunaan uji F yang paling umum adalah untuk menguji signifikansi model regresi secara keseluruhan . Pada contoh berikut, kami menunjukkan cara menghitung nilai p dari statistik F untuk model regresi.

Contoh: Menghitung nilai p dari statistik F

Katakanlah kita memiliki kumpulan data yang menunjukkan jumlah jam belajar, jumlah ujian persiapan yang diambil, dan nilai ujian akhir untuk 12 siswa berbeda:

 #create dataset
data <- data.frame(study_hours = c(3, 7, 16, 14, 12, 7, 4, 19, 4, 8, 8, 3),
prep_exams = c(2, 6, 5, 2, 7, 4, 4, 2, 8, 4, 1, 3),
final_score = c(76, 88, 96, 90, 98, 80, 86, 89, 68, 75, 72, 76))

#view first six rows of dataset
head(data)

# study_hours prep_exams final_score
#1 3 2 76
#2 7 6 88
#3 16 5 96
#4 14 2 90
#5 12 7 98
#6 7 4 80

Kemudian kita dapat menyesuaikan model regresi linier dengan data tersebut dengan menggunakan jam belajar dan persiapan ujian sebagai variabel prediktor dan nilai akhir sebagai variabel respon. Kemudian kita dapat memvisualisasikan hasil modelnya:

 #fit regression model
model <- lm(final_score ~ study_hours + prep_exams, data = data)

#view output of the model
summary(model)

#Call:
#lm(formula = final_score ~ study_hours + prep_exams, data = data)
#
#Residuals:
# Min 1Q Median 3Q Max 
#-13,128 -5,319 2,168 3,458 9,341 
#
#Coefficients:
#Estimate Std. Error t value Pr(>|t|)    
#(Intercept) 66,990 6,211 10,785 1.9e-06 ***
#study_hours 1.300 0.417 3.117 0.0124 *  
#prep_exams 1.117 1.025 1.090 0.3041    
#---
#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#
#Residual standard error: 7.327 on 9 degrees of freedom
#Multiple R-squared: 0.5308, Adjusted R-squared: 0.4265 
#F-statistic: 5.091 on 2 and 9 DF, p-value: 0.0332

Pada baris terakhir hasil, kita dapat melihat bahwa statistik F untuk model regresi keseluruhan adalah 5.091 . Statistik F ini mempunyai 2 derajat kebebasan untuk pembilangnya dan 9 derajat kebebasan untuk penyebutnya. R secara otomatis menghitung bahwa nilai p untuk statistik F ini adalah 0,0332 .

Untuk menghitung sendiri nilai p yang setara ini, kita dapat menggunakan kode berikut:

 pf(5.091, 2, 9, lower.tail = FALSE)

#[1] 0.0331947

Perhatikan bahwa kita mendapatkan jawaban yang sama (tetapi dengan lebih banyak angka desimal yang ditampilkan) seperti keluaran regresi linier di atas.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *