Pengenalan singkat tentang pembelajaran yang diawasi dan tidak diawasi
Bidang pembelajaran mesin berisi serangkaian besar algoritma yang dapat digunakan untuk memahami data. Algoritma ini dapat diklasifikasikan ke dalam salah satu dari dua kategori berikut:
1. Algoritme pembelajaran yang diawasi: melibatkan pembuatan model untuk memperkirakan atau memprediksi hasil berdasarkan satu atau lebih masukan.
2. Algoritme pembelajaran tanpa pengawasan: melibatkan pencarian struktur dan hubungan dari masukan. Tidak ada keluaran “pengawasan”.
Tutorial ini menjelaskan perbedaan kedua jenis algoritma ini beserta beberapa contohnya masing-masing.
Algoritme pembelajaran yang diawasi
Algoritme pembelajaran terbimbing dapat digunakan ketika kita memiliki satu atau lebih variabel penjelas ( X1 , X2 , X3 ,…, Xp ) dan variabel respons (Y) dan kami ingin mencari fungsi yang menggambarkan hubungan antara variabel penjelas dan variabel respons:
Y = f (X) + ε
di mana f mewakili informasi sistematis yang diberikan X tentang Y dan di mana ε adalah suku kesalahan acak yang tidak bergantung pada X dengan rata-rata nol.
Ada dua jenis utama algoritma pembelajaran yang diawasi:
1. Regresi: variabel keluarannya kontinu (misalnya berat badan, tinggi badan, waktu, dll.)
2. Klasifikasi: Variabel keluaran bersifat kategoris (misalnya laki-laki atau perempuan, keberhasilan atau kegagalan, jinak atau ganas, dll.)
Ada dua alasan utama mengapa kami menggunakan algoritma pembelajaran yang diawasi:
1. Prediksi: Kita sering menggunakan serangkaian variabel penjelas untuk memprediksi nilai variabel respons (misalnya, menggunakan luas persegi dan jumlah kamar tidur untuk memprediksi harga sebuah rumah ).
2. Inferensi: Kita mungkin tertarik untuk memahami bagaimana variabel respons terpengaruh ketika nilai variabel penjelas berubah (misalnya, berapa rata-rata kenaikan harga real estat ketika jumlah kamar bertambah satu?)
Bergantung pada apakah tujuan kita adalah inferensi atau prediksi (atau gabungan keduanya), kita dapat menggunakan metode berbeda untuk memperkirakan fungsi f . Misalnya, model linier menawarkan interpretasi yang lebih mudah, namun model nonlinier yang sulit diinterpretasikan mungkin menawarkan prediksi yang lebih akurat.
Berikut adalah daftar algoritma pembelajaran terawasi yang paling umum digunakan:
- Regresi linier
- Regresi logistik
- Analisis diskriminan linier
- Analisis diskriminan kuadrat
- Pohon keputusan
- Bayes yang naif
- Mendukung mesin vektor
- Jaringan saraf
Algoritme pembelajaran tanpa pengawasan
Algoritme pembelajaran tanpa pengawasan dapat digunakan ketika kita memiliki daftar variabel ( X 1 , data.
Ada dua jenis utama algoritma pembelajaran tanpa pengawasan:
1. Pengelompokan: Dengan menggunakan algoritma jenis ini, kami mencoba menemukan “pengelompokan” pengamatan dalam kumpulan data yang mirip satu sama lain. Hal ini sering digunakan dalam ritel ketika sebuah bisnis ingin mengidentifikasi kelompok pelanggan dengan kebiasaan pembelian yang serupa sehingga mereka dapat membuat strategi pemasaran khusus yang menyasar kelompok pelanggan tertentu.
2. Asosiasi: Dengan menggunakan algoritma jenis ini, kami mencoba menemukan “aturan” yang dapat digunakan untuk membangun asosiasi. Misalnya, pengecer dapat mengembangkan algoritma asosiasi yang menunjukkan bahwa “jika pelanggan membeli produk X, kemungkinan besar mereka juga akan membeli produk Y.”
Berikut adalah daftar algoritma pembelajaran tanpa pengawasan yang paling umum digunakan:
- Analisis komponen utama
- Pengelompokan K-means
- Pengelompokan K-medoid
- Klasifikasi hierarki
- Algoritma apriori
Ringkasan: Pembelajaran yang diawasi atau tidak diawasi
Tabel berikut merangkum perbedaan antara algoritma pembelajaran yang diawasi dan tidak diawasi:
Dan diagram berikut merangkum jenis-jenis algoritma pembelajaran mesin: