การแนะนำอย่างรวดเร็วเกี่ยวกับการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้ดูแล
สาขาการเรียนรู้ของเครื่องประกอบด้วยชุดอัลกอริธึมจำนวนมหาศาลที่สามารถใช้เพื่อทำความเข้าใจข้อมูลได้ อัลกอริธึมเหล่านี้สามารถจำแนกได้เป็นประเภทใดประเภทหนึ่งต่อไปนี้:
1. อัลกอริธึมการเรียนรู้แบบมีผู้สอน: เกี่ยวข้องกับการสร้างแบบจำลองเพื่อประมาณหรือทำนายผลลัพธ์ตามอินพุตตั้งแต่หนึ่งรายการขึ้นไป
2. อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแล: เกี่ยวข้องกับการค้นหาโครงสร้างและความสัมพันธ์จากอินพุต ไม่มีผลลัพธ์จาก “การควบคุมดูแล”
บทช่วยสอนนี้จะอธิบายความแตกต่างระหว่างอัลกอริธึมทั้งสองประเภทนี้พร้อมกับตัวอย่างต่างๆ ของอัลกอริธึมแต่ละประเภท
อัลกอริธึมการเรียนรู้ภายใต้การดูแล
อั ลกอริธึมการเรียนรู้แบบ มีผู้สอน สามารถ ใช้ได้ เมื่อเรามีตัวแปรอธิบายหนึ่งรายการขึ้นไป ( X1 ตัวแปรตอบสนอง:
Y = ฉ (X) + ε
โดยที่ f แสดงถึงข้อมูลที่เป็นระบบที่ X ให้ไว้เกี่ยวกับ Y และโดยที่ ε คือคำที่มีข้อผิดพลาดแบบสุ่มซึ่งเป็นอิสระจาก X โดยมีค่าเฉลี่ยเป็นศูนย์
อัลกอริธึมการเรียนรู้แบบมีผู้สอนมีสองประเภทหลัก:
1. การถดถอย: ตัวแปรเอาท์พุตเป็นแบบต่อเนื่อง (เช่น น้ำหนัก ส่วนสูง เวลา ฯลฯ)
2. การจำแนกประเภท: ตัวแปรเอาท์พุตเป็นแบบหมวดหมู่ (เช่น ชายหรือหญิง สำเร็จหรือล้มเหลว เป็นพิษเป็นภัยหรือร้าย เป็นต้น)
มีสองเหตุผลหลักว่าทำไมเราถึงใช้อัลกอริธึมการเรียนรู้แบบมีผู้สอน:
1. การทำนาย: เรามักจะใช้ชุดตัวแปรอธิบายเพื่อทำนายค่าของตัวแปรตอบสนอง (เช่น การใช้ พื้นที่เป็นตารางฟุต และ จำนวนห้องนอน เพื่อทำนาย ราคาบ้าน )
2. การอนุมาน: เราอาจสนใจที่จะทำความเข้าใจว่าตัวแปรตอบสนองได้รับผลกระทบอย่างไรเมื่อค่าของตัวแปรอธิบายเปลี่ยนแปลงไป (เช่น โดยเฉลี่ยแล้วราคาอสังหาริมทรัพย์จะเพิ่มขึ้นเท่าใด เมื่อจำนวนห้องเพิ่มขึ้นทีละห้อง)
ขึ้นอยู่กับว่าเป้าหมายของเราเป็นการอนุมานหรือการทำนาย (หรือทั้งสองอย่างผสมกัน) เราสามารถใช้วิธีต่างๆ เพื่อประมาณค่าฟังก์ชัน f ได้ ตัวอย่างเช่น โมเดลเชิงเส้นให้การตีความที่ง่ายกว่า แต่โมเดลที่ไม่เชิงเส้นที่ยากในการตีความอาจให้การคาดการณ์ที่แม่นยำยิ่งขึ้น
นี่คือรายการอัลกอริธึมการเรียนรู้แบบมีผู้สอนที่ใช้บ่อยที่สุด:
- การถดถอยเชิงเส้น
- การถดถอยโลจิสติก
- การวิเคราะห์จำแนกเชิงเส้น
- การวิเคราะห์จำแนกกำลังสอง
- ต้นไม้การตัดสินใจ
- ไร้เดียงสา เบย์ส
- รองรับเครื่องเวกเตอร์
- โครงข่ายประสาทเทียม
อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแล
อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแล สามารถใช้ได้เมื่อ เรา มีรายการ ตัวแปร ( X 1 , ข้อมูล
อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลมีสองประเภทหลัก:
1. การจัดกลุ่ม: การใช้อัลกอริธึมประเภทนี้ เราพยายามค้นหา “กลุ่ม” ของ การสังเกต ในชุดข้อมูลที่คล้ายคลึงกัน ซึ่งมักใช้ในการค้าปลีกเมื่อธุรกิจต้องการระบุกลุ่มลูกค้าที่มีพฤติกรรมการซื้อคล้ายกัน เพื่อให้พวกเขาสามารถสร้างกลยุทธ์การตลาดเฉพาะเจาะจงที่กำหนดเป้าหมายกลุ่มลูกค้าบางกลุ่มได้
2. การเชื่อมโยง: การใช้อัลกอริธึมประเภทนี้ เราพยายามค้นหา “กฎ” ที่สามารถนำมาใช้เพื่อสร้างการเชื่อมโยงได้ ตัวอย่างเช่น ผู้ค้าปลีกสามารถพัฒนาอัลกอริธึมการเชื่อมโยงที่ระบุว่า “หากลูกค้าซื้อผลิตภัณฑ์ X พวกเขามีแนวโน้มที่จะซื้อสินค้า Y เช่นกัน”
นี่คือรายการอัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลที่ใช้บ่อยที่สุด:
- การวิเคราะห์องค์ประกอบหลัก
- การจัดกลุ่ม K-mean
- การจัดกลุ่มของ K-medoids
- การจำแนกประเภทตามลำดับชั้น
- อัลกอริธึมนิรนัย
สรุป: การเรียนรู้แบบมีผู้สอนหรือไม่มีผู้ดูแล
ตารางต่อไปนี้สรุปความแตกต่างระหว่างอัลกอริธึมการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้ดูแล:
และแผนภาพต่อไปนี้จะสรุปประเภทของอัลกอริทึมการเรียนรู้ของเครื่อง: