Cara melakukan regresi kuadrat di excel
Regresi adalah teknik statistik yang dapat kita gunakan untuk menjelaskan hubungan antara satu atau lebih variabel prediktor dan variabel respon. Jenis regresi yang paling umum adalah regresi linier , yang kita gunakan jika hubungan antara variabel prediktor dan variabel respons adalah linier .
Dengan kata lain, ketika variabel prediktor meningkat maka variabel respon cenderung meningkat pula. Misalnya, kita dapat menggunakan model regresi linier untuk menggambarkan hubungan antara jumlah jam belajar (variabel prediktor) dan nilai yang diterima siswa dalam suatu ujian (variabel respon).
Namun terkadang hubungan antara variabel prediktor dan variabel respon bersifat nonlinier . Jenis hubungan nonlinier yang umum adalah hubungan kuadrat , yang mungkin terlihat seperti U atau U terbalik pada grafik.
Artinya, semakin besar variabel prediktor maka variabel respon cenderung meningkat, namun setelah suatu titik tertentu variabel respon mulai menurun seiring dengan meningkatnya variabel prediktor.
Misalnya, kita dapat menggunakan model regresi kuadratik untuk menggambarkan hubungan antara jumlah jam yang dihabiskan untuk bekerja dan tingkat kebahagiaan yang dilaporkan seseorang. Mungkin semakin banyak seseorang bekerja, semakin mereka merasa puas, namun begitu mereka mencapai ambang batas tertentu, semakin banyak pekerjaan justru menyebabkan stres dan menurunnya kebahagiaan. Dalam hal ini, model regresi kuadratik akan lebih cocok dengan data dibandingkan model regresi linier.
Mari kita tinjau contoh cara melakukan regresi kuadrat di Excel.
Regresi Kuadrat di Excel
Misalkan kita memiliki data jumlah jam kerja per minggu dan tingkat kebahagiaan yang dilaporkan (dalam skala 0 hingga 100) untuk 16 orang berbeda:
Pertama, mari buat diagram sebar untuk melihat apakah regresi linier merupakan model yang sesuai dengan data.
Sorot sel A2:B17 . Selanjutnya, klik tab INSERT di sepanjang pita atas, lalu klik Menyebar di area Bagan . Ini akan menghasilkan diagram sebar data:
Sangat mudah untuk melihat bahwa hubungan antara jam kerja dan kebahagiaan yang dilaporkan tidaklah linier. Faktanya, ia mengikuti bentuk “U”, menjadikannya kandidat sempurna untuk regresi kuadratik .
Sebelum menyesuaikan model regresi kuadrat ke data, kita perlu membuat kolom baru untuk nilai kuadrat dari variabel prediktor kita.
Pertama, sorot semua nilai di kolom B dan seret ke kolom C.
Selanjutnya ketikkan rumus =A2^2 pada sel B2. Ini menghasilkan nilai 36 . Selanjutnya, klik pojok kanan bawah sel B2 dan seret rumus ke bawah untuk mengisi sisa sel di kolom B.
Selanjutnya, kita akan menyesuaikan model regresi kuadratik.
Klik DATA di sepanjang pita atas, lalu klik opsi Analisis Data di paling kanan. Jika Anda tidak melihat opsi ini, Anda harus menginstal perangkat lunak Analysis ToolPak gratis terlebih dahulu.
Setelah Anda mengklik Analisis Data , sebuah kotak akan muncul. Klik Regresi , lalu klik OK .
Selanjutnya isikan nilai berikut pada kotak Regresi yang muncul. Lalu klik oke .
Hasil berikut akan ditampilkan:
Berikut cara menafsirkan angka-angka berbeda dalam output:
R Square: Dikenal juga dengan koefisien determinasi, yaitu proporsi varians variabel respon yang dapat dijelaskan oleh variabel prediktor. Dalam contoh ini, R square adalah 0,9092 , yang menunjukkan bahwa 90,92% varian tingkat kebahagiaan yang dilaporkan dapat dijelaskan oleh jumlah jam kerja dan jumlah jam kerja ^2.
Kesalahan standar: Kesalahan standar regresi adalah jarak rata-rata antara nilai yang diamati dan garis regresi. Dalam contoh ini, nilai yang diamati rata-rata menyimpang sebesar 9.519 unit dari garis regresi.
F-statistik : F-statistik dihitung sebagai MS regresi/MS sisa. Statistik ini menunjukkan apakah model regresi memberikan kesesuaian yang lebih baik terhadap data dibandingkan model yang tidak memuat variabel independen. Pada dasarnya, ini menguji apakah model regresi secara keseluruhan bermanfaat. Secara umum, jika tidak ada variabel prediktor dalam model yang signifikan secara statistik, maka statistik F keseluruhan juga tidak signifikan secara statistik. Dalam contoh ini, statistik F adalah 65,09 dan nilai p yang sesuai adalah <0,0001. Karena nilai p kurang dari 0,05, model regresi secara keseluruhan adalah signifikan.
Koefisien regresi: Koefisien regresi pada tabel terakhir memberikan kita angka-angka yang diperlukan untuk menulis estimasi persamaan regresi:
kamu topi = b 0 + b 1 x 1 + b 2 x 1 2
Dalam contoh ini, persamaan regresi yang diperkirakan adalah:
tingkat kebahagiaan yang dinyatakan = -30,252 + 7,173 (Jam kerja) -0,106 (Jam kerja) 2
Kita dapat menggunakan persamaan ini untuk menghitung tingkat kebahagiaan yang diharapkan seseorang berdasarkan jam kerja mereka. Misalnya tingkat kebahagiaan yang diharapkan dari seseorang yang bekerja 30 jam per minggu adalah:
tingkat kebahagiaan yang dilaporkan = -30.252 + 7.173(30) -0.106(30) 2 = 88.649 .
Sumber daya tambahan
Bagaimana cara menambahkan garis tren kuadrat di Excel
Cara Membaca dan Menafsirkan Tabel Regresi
Berapa nilai R-kuadrat yang bagus?
Memahami Kesalahan Standar Regresi
Panduan Sederhana untuk Memahami Uji F dari Signifikansi Keseluruhan dalam Regresi