Cara menafsirkan nilai p dalam regresi linier (dengan contoh)


Dalam statistik, model regresi linier digunakan untuk mengukur hubungan antara satu atau lebih variabel prediktor dan variabel respon .

Setiap kali Anda melakukan analisis regresi menggunakan perangkat lunak statistik, Anda akan menerima tabel regresi yang merangkum hasil model.

Dua nilai terpenting dalam tabel regresi adalah koefisien regresi dan nilai p yang sesuai.

Nilai p memberi tahu Anda apakah terdapat hubungan yang signifikan secara statistik antara setiap variabel prediktor dan variabel respons.

Contoh berikut menunjukkan cara menafsirkan nilai p dari model regresi linier berganda dalam praktiknya.

Contoh: Menafsirkan Nilai P dalam Model Regresi

Misalkan kita ingin menyesuaikan model regresi dengan menggunakan variabel berikut:

Variabel prediktor

  • Total jumlah jam belajar (antara 0 dan 20)
  • Apakah siswa tersebut menggunakan tutor atau tidak (ya atau tidak)

Variabel respon

  • Skor ujian (antara 0 dan 100)

Kami ingin menguji hubungan antara variabel prediktor dan variabel respon untuk mengetahui apakah jam belajar dan les benar-benar berdampak signifikan terhadap nilai ujian.

Misalkan kita melakukan analisis regresi dan memperoleh hasil sebagai berikut:

Ketentuan Koefisien Kesalahan standar t Statistik Nilai-P
Mencegat 48.56 14:32 3.39 0,002
Berjam-jam belajar 2.03 0,67 3.03 0,009
guru 8.34 5.68 1.47 0,138

Berikut cara menginterpretasikan hasil setiap term dalam model:

Interpretasi nilai P untuk intersep

Istilah asli dalam tabel regresi memberi tahu kita nilai rata-rata yang diharapkan untuk variabel respons ketika semua variabel prediktor sama dengan nol.

Dalam contoh ini, koefisien regresi titik asal sama dengan 48.56 . Artinya bagi siswa yang belajar nol jam , rata-rata nilai ujian yang diharapkan adalah 48,56.

Nilai p-nya adalah 0,002 , yang menunjukkan bahwa suku asli secara statistik berbeda dari nol.

Dalam praktiknya, kita umumnya tidak peduli dengan nilai p untuk suku aslinya. Bahkan jika nilai p tidak berada di bawah tingkat signifikansi tertentu (misalnya 0,05), kita akan tetap mempertahankan suku asli dalam model.

Menafsirkan nilai P untuk variabel prediktor kontinu

Dalam contoh ini, jam belajar merupakan variabel prediktor kontinu yang berkisar antara 0 hingga 20 jam.

Dari hasil regresi terlihat bahwa koefisien regresi jam belajar adalah 2,03 . Artinya, rata-rata, setiap tambahan jam belajar dikaitkan dengan peningkatan sebesar 2,03 poin pada ujian akhir, dengan asumsi variabel prediktor Tutor dijaga konstan.

Misalnya saja siswa A yang belajar selama 10 jam dan menggunakan tutor. Pertimbangkan juga Siswa B yang belajar selama 11 jam dan juga menggunakan tutor. Berdasarkan hasil regresi kami, Siswa B diperkirakan mendapat nilai ujian 2,03 poin lebih tinggi daripada Siswa A.

Nilai p yang sesuai adalah 0,009 , yang signifikan secara statistik pada tingkat alfa 0,05.

Hal ini menunjukkan kepada kita bahwa rata-rata perubahan nilai ujian untuk setiap jam belajar tambahan secara statistik berbeda secara signifikan dari nol .

Dengan kata lain: jam belajar mempunyai hubungan yang signifikan secara statistik dengan variabel respon nilai ujian .

Menafsirkan nilai P untuk variabel prediktor kategoris

Dalam contoh ini, Tutor adalah variabel prediktor kategoris yang dapat mengambil dua nilai berbeda:

  • 1 = siswa menggunakan tutor untuk mempersiapkan ujian
  • 0 = siswa tidak menggunakan tutor untuk mempersiapkan ujian

Dari hasil regresi terlihat bahwa koefisien regresi untuk Tutor adalah 8,34 . Artinya, rata-rata, siswa yang menggunakan tutor mendapat nilai ujian 8,34 poin lebih tinggi dibandingkan siswa yang tidak menggunakan tutor, dengan asumsi variabel prediktor Jam belajar tetap konstan.

Misalnya saja siswa A yang belajar selama 10 jam dan menggunakan tutor. Pertimbangkan juga Siswa B yang belajar selama 10 jam dan tidak menggunakan tutor. Berdasarkan hasil regresi kami, Siswa A diharapkan mendapat nilai ujian 8,34 poin lebih tinggi daripada Siswa B.

Nilai p yang sesuai adalah 0,138 , yang tidak signifikan secara statistik pada tingkat alfa 0,05.

Hal ini menunjukkan bahwa rata-rata perubahan nilai ujian untuk setiap jam tambahan pembelajaran tidak berbeda signifikan secara statistik dari nol .

Dengan kata lain: variabel prediktor Tutor tidak memiliki hubungan yang signifikan secara statistik dengan variabel respon nilai ujian .

Hal ini menunjukkan bahwa meskipun siswa yang menggunakan tutor mempunyai nilai ujian yang lebih baik, perbedaan ini mungkin disebabkan oleh keberuntungan.

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang regresi linier:

Bagaimana menafsirkan uji F untuk signifikansi keseluruhan dalam regresi
Lima asumsi regresi linier berganda
Memahami uji-t dalam regresi linier

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *