مقدمة بسيطة لتعزيز التعلم الآلي


تعتمد معظم خوارزميات التعلم الآلي الخاضعة للإشراف على استخدام نموذج تنبؤي واحد مثل الانحدار الخطي ، والانحدار اللوجستي ، وانحدار التلال ، وما إلى ذلك.

ومع ذلك، فإن طرق مثل التعبئة والغابات العشوائية تبني العديد من النماذج المختلفة بناءً على عينات متكررة من مجموعة البيانات الأصلية. يتم إجراء التنبؤات على البيانات الجديدة من خلال أخذ متوسط التنبؤات التي قدمتها النماذج الفردية.

تميل هذه الطرق إلى تقديم تحسين في دقة التنبؤ مقارنة بالطرق التي تستخدم نموذجًا تنبؤيًا واحدًا فقط لأنها تستخدم العملية التالية:

هناك طريقة أخرى تميل إلى تقديم تحسين أكبر في الدقة التنبؤية تُعرف باسم التعزيز .

ما هو التعزيز؟

التعزيز هو أسلوب يمكن استخدامه مع أي نوع من النماذج، ولكنه يُستخدم غالبًا مع أشجار القرار.

الفكرة وراء التعزيز بسيطة:

1. أولاً، قم ببناء نموذج ضعيف.

  • النموذج “الضعيف” هو النموذج الذي يكون معدل الخطأ فيه أفضل قليلاً من التقدير العشوائي.
  • من الناحية العملية، عادةً ما تكون هذه شجرة قرارات مكونة من قسم واحد أو قسمين فقط.

2. بعد ذلك، قم ببناء نموذج ضعيف آخر بناءً على بقايا النموذج السابق.

  • ومن الناحية العملية، نستخدم المتبقي من النموذج السابق (أي الأخطاء في توقعاتنا) لملاءمة نموذج جديد يؤدي إلى تحسين معدل الخطأ الإجمالي بشكل طفيف.

3. استمر في هذه العملية حتى يخبرنا التحقق المتبادل k-fold بالتوقف.

باستخدام هذه الطريقة يمكننا البدء بنموذج ضعيف والاستمرار في “تحسين” أدائه من خلال بناء أشجار جديدة بشكل تسلسلي تعمل على تحسين أداء الشجرة السابقة حتى نحصل على نموذج نهائي ذو دقة تنبؤية عالية.

تعزيز التعلم الآلي

لماذا يعمل التعزيز؟

لقد اتضح أن التعزيز قادر على إنتاج بعض أقوى النماذج في مجال التعلم الآلي.

في العديد من الصناعات، يتم استخدام النماذج المعززة كنماذج مرجعية في الإنتاج لأنها تميل إلى التفوق على جميع النماذج الأخرى.

يرجع السبب وراء نجاح النماذج المعززة إلى فهم فكرة بسيطة:

1. أولاً، تقوم النماذج المحسنة ببناء شجرة قرارات ضعيفة ذات دقة تنبؤية منخفضة. ويقال إن شجرة القرار هذه لديها تباين منخفض وتحيز عالي.

2. بما أن النماذج المحسنة تتبع عملية التحسين التسلسلي لأشجار القرار السابقة، فإن النموذج العام قادر على تقليل التحيز ببطء في كل خطوة دون زيادة التباين بشكل ملحوظ.

3. يميل النموذج النهائي المجهز إلى أن يكون لديه انحياز وتباين منخفض بما فيه الكفاية، مما يؤدي إلى نموذج قادر على إنتاج معدلات خطأ منخفضة في الاختبار على البيانات الجديدة.

مزايا وعيوب التعزيز

الميزة الواضحة للتعزيز هي أنه قادر على إنتاج نماذج ذات دقة تنبؤية عالية مقارنة بجميع أنواع النماذج الأخرى تقريبًا.

العيب المحتمل هو أن النموذج المحسن المجهز يصعب تفسيره. وعلى الرغم من أنه يمكن أن يوفر قدرة هائلة على التنبؤ بقيم الاستجابة للبيانات الجديدة، إلا أنه من الصعب شرح العملية الدقيقة التي يستخدمها لتحقيق ذلك.

من الناحية العملية، يقوم معظم علماء البيانات وممارسي التعلم الآلي بإنشاء نماذج محسنة لأنهم يريدون أن يكونوا قادرين على التنبؤ بدقة بقيم الاستجابة للبيانات الجديدة. وبالتالي، فإن حقيقة صعوبة تفسير النماذج المحسنة لا تمثل مشكلة بشكل عام.

الداعم في الممارسة العملية

من الناحية العملية، هناك أنواع عديدة من الخوارزميات المستخدمة للتعزيز، بما في ذلك:

اعتمادًا على حجم مجموعة البيانات لديك وقوة المعالجة بجهازك، قد تكون إحدى هذه الطرق مفضلة على الأخرى.

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *