Apa yang dijelaskan oleh varians? (definisi & #038; contoh)
Varians yang dijelaskan (terkadang disebut “variasi yang dijelaskan”) mengacu pada varians variabel respons dalam model yang dapat dijelaskan oleh variabel prediktor model.
Semakin tinggi varians yang dijelaskan suatu model, semakin banyak variasi data yang mampu dijelaskan oleh model tersebut.
Varians yang dijelaskan muncul dalam hasil dua model statistik yang berbeda:
1. ANOVA: digunakan untuk membandingkan rata-rata tiga atau lebih kelompok independen.
2. Regresi: digunakan untuk mengukur hubungan antara satu atau lebih variabel prediktor dan variabel respon.
Contoh berikut menunjukkan bagaimana menafsirkan varians sisa dalam masing-masing metode.
Catatan : Kebalikan dari varians yang dijelaskan disebut varians sisa .
Varians dijelaskan dalam model ANOVA
Setiap kali kita menyesuaikan model ANOVA (“analisis varians”), kita akan mendapatkan tabel ANOVA yang terlihat seperti berikut:
Varians yang dijelaskan terdapat di kolom SS (“jumlah kuadrat”) untuk variasi antar kelompok .
Pada model ANOVA di atas terlihat varians yang dijelaskan adalah 192,2.
Untuk menentukan apakah varians yang dijelaskan ini adalah “tinggi”, kita dapat menghitung jumlah rata-rata kuadrat dalam kelompok dan jumlah rata-rata kuadrat antar kelompok dan mencari rasio antara keduanya, yang menghasilkan nilai F keseluruhan dalam tabel ANOVA.
- F = MS masuk / MS masuk
- F = 96,1 / 40,76296
- F = 2,357
Nilai F pada tabel ANOVA di atas adalah 2,357 dan nilai p yang sesuai adalah 0,113848.
Karena nilai p ini tidak kurang dari α = 0,05, kami tidak memiliki cukup bukti untuk menolak hipotesis nol ANOVA .
Artinya, kami tidak memiliki cukup bukti untuk menyatakan bahwa perbedaan rata-rata antara kelompok yang kami bandingkan berbeda secara signifikan.
Hal ini menunjukkan bahwa varians yang dijelaskan dalam model ANOVA lebih kecil dibandingkan dengan varians yang tidak dijelaskan.
Varians dijelaskan dalam model regresi
Dalam model regresi, varians yang dijelaskan diringkas sebagai R-squared , sering kali ditulis R2 .
Nilai ini mewakili proporsi varians variabel respon yang dapat dijelaskan oleh variabel prediktor dalam model.
Nilai R kuadrat dapat berkisar dari 0 hingga dimana:
- Nilai 0 menunjukkan bahwa variabel respon sama sekali tidak dapat dijelaskan oleh variabel prediktor.
- Nilai 1 menunjukkan bahwa variabel respon dapat dijelaskan dengan sempurna tanpa kesalahan oleh variabel prediktor.
Saat kita menyesuaikan model regresi, biasanya kita mendapatkan hasil seperti berikut:
Terlihat varians yang dijelaskan adalah 168.5976 dan varians totalnya adalah 174.5 .
Dengan menggunakan nilai-nilai ini, kita dapat menghitung nilai R-kuadrat untuk model regresi ini sebagai berikut:
- R kuadrat: Regresi SS / Total SS
- R kuadrat: 168.5976 / 174.5
- R kuadrat: 0,966
Karena nilai R-kuadrat model ini mendekati 1, hal ini menunjukkan bahwa varians yang dijelaskan dalam model sangat tinggi.
Dengan kata lain, model mampu menggunakan variabel prediktor dengan baik untuk menjelaskan variasi dalam variabel respon.
Terkait: Berapa nilai R-kuadrat yang bagus?