Cara menghitung rmse di sas
Salah satu cara untuk mengevaluasi seberapa cocok model regresi dengan kumpulan data adalah dengan menghitung mean squared error , yaitu metrik yang memberi tahu kita jarak rata-rata antara nilai prediksi model dan nilai sebenarnya dari kumpulan data.
Semakin rendah RMSE, semakin baik model tertentu mampu “menyesuaikan” kumpulan data.
Rumus untuk mencari mean square error yang sering disingkat RMSE adalah:
RMSE = √ Σ(P saya – O saya ) 2 / n
Emas:
- Σ adalah simbol yang melambangkan “jumlah”
- P i adalah nilai prediksi observasi ke-i dalam dataset
- O i adalah nilai observasi untuk observasi ke-i dalam kumpulan data
- n adalah ukuran sampel
Contoh langkah demi langkah berikut menunjukkan cara menghitung RMSE untuk model regresi linier sederhana di SAS.
Langkah 1: Buat datanya
Untuk contoh ini, kita akan membuat dataset yang berisi jumlah jam belajar dan nilai ujian akhir 15 siswa.
Kami akan menyesuaikan model regresi linier sederhana dengan menggunakan jam sebagai variabel prediktor dan skor sebagai variabel respon.
Kode berikut menunjukkan cara membuat kumpulan data ini di SAS:
/*create dataset*/ data exam_data; input hours score; datalines ; 1 64 2 66 4 76 5 73 5 74 6 81 6 83 7 82 8 80 10 88 11 84 11 82 12 91 12 93 14 89 ; run ; /*view dataset*/ proc print data =exam_data;
Langkah 2: Sesuaikan model regresi linier sederhana
Selanjutnya, kita akan menggunakan proc reg agar sesuai dengan model regresi linier sederhana:
/*fit simple linear regression model*/ proc reg data =exam_data; model score = hours; run ;
Perhatikan bahwa RMSE pada keluarannya adalah 3.64093 .
Langkah 3: Ekstrak RMSE dari model regresi
Jika Anda hanya ingin menampilkan RMSE model ini dan tidak ada hasil keluaran lainnya, Anda dapat menggunakan kode berikut:
/*fit simple linear regression model*/ proc reg data =exam_data outest =outest noprint ; model score = hours / rmse ; run ; quit ; /*print RMSE of model*/ proc print data =outest; var _RMSE_; run ;
Perhatikan bahwa hanya nilai RMSE 3,64093 yang ditampilkan di output.
Catatan : Argumen noprint di proc reg memberitahu SAS untuk tidak mencetak seluruh output hasil regresi seperti yang dilakukan pada langkah sebelumnya.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di SAS:
Cara melakukan regresi linier sederhana di SAS
Cara melakukan regresi linier berganda di SAS
Cara melakukan regresi polinomial di SAS
Cara melakukan regresi logistik di SAS