Cara melakukan regresi linier di google sheets


Regresi linier adalah metode yang dapat digunakan untuk mengukur hubungan antara satu atau lebih variabel penjelas dan variabel respon .

Kami menggunakan regresi linier sederhana jika hanya ada satu variabel penjelas dan regresi linier berganda jika terdapat dua atau lebih variabel penjelas.

Kedua jenis regresi dapat dilakukan menggunakan fungsi Google Sheets LINEST() , yang menggunakan sintaks berikut:

LINEST (diketahui_data_y, diketahui_data_x, hitung_b, verbose)

Emas:

  • unknown_data_y: array nilai respons
  • unknown_data_x: Tabel nilai penjelasan
  • hitung_b: menunjukkan apakah akan menghitung intersep atau tidak. Ini BENAR secara default dan kami membiarkannya seperti itu untuk regresi linier.
  • verbose: Menunjukkan apakah akan memberikan statistik regresi tambahan selain kemiringan dan intersep. Ini adalah FALSE secara default, namun kami akan menentukan bahwa ini adalah TRUE dalam contoh kami.

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Regresi linier sederhana di Google Spreadsheet

Misalkan kita ingin memahami hubungan antara jam belajar dan hasil ujian. belajar untuk ujian dan nilai yang diperoleh pada ujian tersebut.

Untuk mengeksplorasi hubungan ini, kita dapat melakukan regresi linier sederhana dengan menggunakan jam belajar sebagai variabel penjelas dan nilai ujian sebagai variabel respon.

Tangkapan layar berikut menunjukkan cara melakukan regresi linier sederhana menggunakan kumpulan data 20 siswa dengan rumus berikut digunakan di sel D2:

= GARIS ( B2:B21 , A2:A21 , BENAR , BENAR )

Regresi Linier di Google Spreadsheet

Tangkapan layar berikut memberikan anotasi untuk keluarannya:

Keluaran regresi di Google Spreadsheet

Berikut cara menafsirkan angka paling relevan dalam hasil:

R Persegi: 0,72725 . Ini disebut koefisien determinasi. Merupakan proporsi varians pada variabel respon yang dapat dijelaskan oleh variabel penjelas. Dalam contoh ini, sekitar 72,73% variasi nilai ujian dapat dijelaskan oleh jumlah jam belajar.

Kesalahan standar: 5.2805 . Ini adalah jarak rata-rata antara nilai yang diamati dan garis regresi. Dalam contoh ini, nilai yang diamati rata-rata menyimpang sebesar 5,2805 unit dari garis regresi.

Koefisien: Koefisien memberi kita angka-angka yang diperlukan untuk menulis persamaan regresi yang diperkirakan. Dalam contoh ini, persamaan regresi yang diperkirakan adalah:

Nilai ujian = 67,16 + 5,2503*(jam)

Kami menafsirkan koefisien jam berarti bahwa untuk setiap tambahan jam belajar, nilai ujian akan meningkat rata-rata 5,2503 . Kami menafsirkan koefisien intersep yang berarti bahwa nilai ujian yang diharapkan untuk siswa yang belajar tanpa jam kerja adalah 67,16 .

Kita dapat menggunakan persamaan regresi perkiraan ini untuk menghitung nilai ujian yang diharapkan seorang siswa, berdasarkan jumlah jam belajar. Misalnya, seorang siswa yang belajar selama tiga jam harus mencapai nilai ujian 82,91 :

Nilai ujian = 67,16 + 5,2503*(3) = 82,91

Regresi Linier Berganda di Google Spreadsheet

Misalkan kita ingin mengetahui apakah jumlah jam yang dihabiskan untuk belajar dan jumlah ujian persiapan yang diambil mempengaruhi nilai yang diperoleh siswa pada ujian masuk perguruan tinggi tertentu.

Untuk mengeksplorasi hubungan ini, kita dapat melakukan regresi linier berganda dengan menggunakan jam belajar dan ujian persiapan yang diambil sebagai variabel penjelas dan hasil ujian sebagai variabel respon.

Tangkapan layar berikut menunjukkan cara melakukan regresi linier berganda menggunakan kumpulan data 20 siswa dengan rumus berikut digunakan di sel E2:

= BENAR ( C2:C21 , A2:B21 , BENAR , BENAR )

Regresi Linier Berganda di Google Spreadsheet

Berikut cara menafsirkan angka paling relevan dalam hasil:

R Persegi: 0,734 . Ini disebut koefisien determinasi. Merupakan proporsi varians variabel respon yang dapat dijelaskan oleh variabel penjelas. Dalam contoh ini, 73,4% variasi nilai ujian dijelaskan oleh jumlah jam belajar dan jumlah persiapan ujian yang diambil.

Kesalahan standar: 5.3657 . Ini adalah jarak rata-rata antara nilai yang diamati dan garis regresi. Dalam contoh ini, nilai yang diamati rata-rata menyimpang sebesar 5,3657 unit dari garis regresi.

Estimasi persamaan regresi: Kita dapat menggunakan koefisien dari keluaran model untuk membuat estimasi persamaan regresi berikut:

Nilai ujian = 67,67 + 5,56*(jam) – 0,60*(ujian persiapan)

Kita dapat menggunakan persamaan regresi perkiraan ini untuk menghitung nilai ujian yang diharapkan seorang siswa, berdasarkan jumlah jam belajar dan jumlah ujian praktik yang mereka ambil. Misalnya, seorang siswa yang belajar selama tiga jam dan mengikuti ujian persiapan harus mendapat nilai 83,75 :

Nilai ujian = 67,67 + 5,56*(3) – 0,60*(1) = 83,75

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di Google Spreadsheet:

Cara melakukan regresi polinomial di Google Spreadsheet
Cara Membuat Plot Sisa di Google Sheets

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *