Cara melakukan regresi linier sederhana di excel
Regresi linier sederhana adalah metode yang dapat kita gunakan untuk memahami hubungan antara variabel penjelas, x, dan variabel respon, y.
Tutorial ini menjelaskan cara melakukan regresi linier sederhana di Excel.
Contoh: Regresi Linier Sederhana di Excel
Misalkan kita ingin memahami hubungan antara jumlah jam belajar siswa untuk ujian dan nilai yang mereka terima pada ujian tersebut.
Untuk mengeksplorasi hubungan ini, kita dapat melakukan regresi linier sederhana dengan menggunakan jam belajar sebagai variabel penjelas dan nilai ujian sebagai variabel respon.
Selesaikan langkah-langkah berikut di Excel untuk melakukan regresi linier sederhana.
Langkah 1: Masukkan datanya.
Masukkan data jumlah jam belajar dan nilai ujian yang diperoleh 20 siswa berikut ini:
Langkah 2: Visualisasikan datanya.
Sebelum melakukan regresi linier sederhana, ada gunanya membuat diagram sebar data untuk memastikan bahwa memang ada hubungan linier antara jam belajar dan nilai ujian.
Sorot data di kolom A dan B. Di sepanjang pita atas Excel, navigasikan ke tab Sisipkan . Di grup Grafik , klik Sisipkan Sebar (X, Y) dan klik opsi pertama berlabel Sebar . Ini secara otomatis akan menghasilkan point cloud berikut:
Jumlah jam belajar ditunjukkan pada sumbu x dan hasil ujian ditunjukkan pada sumbu y. Kita dapat melihat bahwa terdapat hubungan linier antara kedua variabel: semakin banyak jam belajar dikaitkan dengan nilai ujian yang lebih tinggi.
Untuk mengukur hubungan kedua variabel ini, kita dapat melakukan regresi linier sederhana.
Langkah 3: Lakukan regresi linier sederhana.
Di pita atas Excel, buka tab Data dan klik Analisis Data . Jika Anda tidak melihat opsi ini, Anda harus menginstal perangkat lunak Analysis ToolPak gratis terlebih dahulu.
Setelah Anda mengklik Analisis Data, jendela baru akan muncul. Pilih Regresi dan klik OK.
Untuk Input Y Range , isi array nilai untuk variabel respon. Untuk Input X Range , isi array nilai untuk variabel penjelas.
Centang kotak di samping Label untuk memberi tahu Excel bahwa kami telah menyertakan nama variabel dalam rentang input.
Untuk Rentang Output , pilih sel yang Anda inginkan untuk menampilkan output regresi.
Lalu klik oke .
Output berikut akan muncul secara otomatis:
Langkah 4: Interpretasikan hasilnya.
Berikut cara menafsirkan angka paling relevan dalam hasil:
R Persegi: 0,7273 . Ini disebut koefisien determinasi. Merupakan proporsi varians pada variabel respon yang dapat dijelaskan oleh variabel penjelas. Dalam contoh ini, 72,73% variasi nilai ujian dijelaskan oleh jumlah jam belajar.
Kesalahan standar: 5.2805 . Ini adalah jarak rata-rata antara nilai yang diamati dan garis regresi. Dalam contoh ini, nilai yang diamati rata-rata menyimpang sebesar 5,2805 unit dari garis regresi.
F: 47.9952 . Ini adalah statistik F keseluruhan untuk model regresi, yang dihitung sebagai MS regresi/MS sisa.
Arti F: 0,0000 . Ini adalah nilai p yang terkait dengan statistik F keseluruhan. Hal ini memberitahu kita apakah model regresi signifikan secara statistik atau tidak. Dengan kata lain, hal ini memberitahu kita apakah variabel penjelas mempunyai hubungan yang signifikan secara statistik dengan variabel respon. Dalam hal ini, nilai p kurang dari 0,05, menunjukkan bahwa terdapat hubungan yang signifikan secara statistik antara jam belajar dan nilai yang diperoleh pada ujian.
Koefisien: Koefisien memberi kita angka-angka yang diperlukan untuk menulis persamaan regresi yang diperkirakan. Dalam contoh ini, persamaan regresi yang diperkirakan adalah:
nilai ujian = 67,16 + 5,2503*(jam)
Kami menafsirkan koefisien jam berarti bahwa untuk setiap tambahan jam belajar, nilai ujian akan meningkat rata-rata 5,2503 . Kami menafsirkan koefisien intersep yang berarti bahwa nilai ujian yang diharapkan untuk siswa yang belajar tanpa jam kerja adalah 67,16 .
Kita dapat menggunakan persamaan regresi perkiraan ini untuk menghitung nilai ujian yang diharapkan seorang siswa, berdasarkan jumlah jam belajar.
Misalnya, seorang siswa yang belajar selama tiga jam harus mencapai nilai ujian 82,91 :
nilai ujian = 67,16 + 5,2503*(3) = 82,91
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di Excel:
Cara Membuat Plot Sisa di Excel
Cara Membuat Interval Prediksi di Excel
Cara Membuat Plot QQ di Excel