Apa yang dimaksud dengan uji f parsial?


Uji F parsial digunakan untuk menentukan ada atau tidaknya perbedaan yang signifikan secara statistik antara model regresi dan versi tersarang dari model yang sama.

Model bersarang hanyalah model yang berisi subkumpulan variabel prediktor dalam model regresi keseluruhan.

Misalnya, kita memiliki model regresi berikut dengan empat variabel prediktor:

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

Contoh model bertingkat adalah model berikut yang hanya memiliki dua variabel prediktor asli:

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

Untuk mengetahui apakah kedua model tersebut berbeda nyata dapat dilakukan uji F parsial.

Tes F parsial: dasar-dasarnya

Uji F parsial menghitung statistik uji F berikut:

F = (( RSS yang Dikurangi – RSS Penuh )/p) / ( RSS Penuh /nk)

Emas:

  • RSS yang Dikurangi : Jumlah sisa kuadrat dari model yang dikurangi (yaitu “bersarang”).
  • RSS penuh : Jumlah sisa kuadrat dari model lengkap.
  • p : jumlah prediktor yang dihapus dari model lengkap.
  • n: jumlah total observasi dalam kumpulan data.
  • k : Jumlah koefisien (termasuk intersep) dalam model lengkap.

Perhatikan bahwa jumlah sisa kuadrat akan selalu lebih kecil untuk model lengkap karena penambahan prediktor akan selalu menghasilkan pengurangan kesalahan.

Jadi uji F parsial pada dasarnya menguji apakah kelompok prediktor yang Anda hapus dari model lengkap benar-benar berguna dan harus disertakan dalam model lengkap.

Pengujian ini menggunakan hipotesis nol dan hipotesis alternatif berikut:

H 0 : Semua koefisien yang dihilangkan dari model penuh adalah nol.

H A : Setidaknya salah satu koefisien yang dikeluarkan dari model lengkap adalah bukan nol.

Jika nilai p yang sesuai dengan statistik uji F berada di bawah tingkat signifikansi tertentu (misalnya 0,05), maka kita dapat menolak hipotesis nol dan menyimpulkan bahwa setidaknya salah satu koefisien yang dikeluarkan dari model lengkap adalah signifikan.

Uji F parsial: sebuah contoh

Dalam praktiknya, kami menggunakan langkah-langkah berikut untuk melakukan uji F parsial:

1. Sesuaikan model regresi penuh dan hitung RSS penuh .

2. Sesuaikan model regresi bersarang dan hitung pengurangan RSS.

3. Lakukan ANOVA untuk membandingkan model penuh dan model tereduksi, yang akan menghasilkan statistik uji F yang diperlukan untuk membandingkan model.

Misalnya, kode berikut menunjukkan cara menyesuaikan dua model regresi berikut di R menggunakan data dari kumpulan data mtcars bawaan:

Model lengkap: mpg = β 0 + β 1 tersedia + β 2 karbohidrat + β 3 hp + β 4 silinder

Model: mpg = β 0 + β 1 tersedia + β 2 karbohidrat

 #fit full model
model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit reduced model
model_reduced <- lm(mpg ~ disp + carb, data = mtcars)

#perform ANOVA to test for differences in models
anova(model_reduced, model_full)

Analysis of Variance Table

Model 1: mpg ~ available + carb
Model 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Sum of Sq F Pr(>F)
1 29 254.82                           
2 27 238.71 2 16.113 0.9113 0.414

Dari hasil tersebut, kita dapat melihat bahwa statistik uji F ANOVA adalah 0,9113 dan nilai p yang sesuai adalah 0,414 .

Karena nilai p ini tidak kurang dari 0,05, kita akan gagal menolak hipotesis nol. Ini berarti bahwa kita tidak memiliki cukup bukti untuk mengatakan bahwa salah satu variabel prediktor hp atau cyl signifikan secara statistik.

Dengan kata lain, menambahkan hp dan cyl ke model regresi tidak meningkatkan kesesuaian model secara signifikan.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *