5 أمثلة على التحليل العنقودي في الحياة الواقعية
التحليل العنقودي هو أسلوب يستخدم في التعلم الآلي يحاول العثور على مجموعات من الملاحظات ضمن مجموعة بيانات.
الهدف من التحليل العنقودي هو العثور على مجموعات بحيث تكون الملاحظات داخل كل مجموعة متشابهة تمامًا مع بعضها البعض، في حين أن الملاحظات في مجموعات مختلفة تختلف تمامًا عن بعضها البعض.
توضح الأمثلة التالية كيفية استخدام التحليل العنقودي في مواقف واقعية مختلفة.
مثال 1: تسويق التجزئة
غالبًا ما تستخدم شركات البيع بالتجزئة التجميع لتحديد مجموعات من الأسر المتشابهة.
على سبيل المثال، قد تقوم شركة البيع بالتجزئة بجمع المعلومات المنزلية التالية:
- دخل الأسرة
- حجم الأسرة
- مهنة رب الأسرة
- المسافة إلى أقرب منطقة حضرية
يمكنهم بعد ذلك إدخال هذه المتغيرات في خوارزمية التجميع لتحديد المجموعات التالية:
- المجموعة 1: العائلات الصغيرة، المنفقون الكبار
- المجموعة 2: عائلة كبيرة، منفقون كبيرون
- المجموعة 3: عائلة صغيرة، نفقات منخفضة
- المجموعة الرابعة: عائلة كبيرة، نفقات قليلة
يمكن للشركة بعد ذلك إرسال إعلانات مخصصة أو رسائل مبيعات إلى كل أسرة بناءً على احتمالية استجابتها لأنواع معينة من الإعلانات.
مثال 2: خدمات البث
غالبًا ما تستخدم خدمات البث التحليل التجميعي لتحديد المشاهدين ذوي السلوك المماثل.
على سبيل المثال، قد تقوم خدمة البث بجمع البيانات التالية عن الأفراد:
- دقائق المشاهدة يوميا
- إجمالي عدد جلسات المشاهدة في الأسبوع
- عدد العروض الفريدة التي يتم مشاهدتها شهريًا
باستخدام هذه المقاييس، يمكن لخدمة البث إجراء تحليل جماعي لتحديد المستخدمين ذوي الاستخدام المرتفع والمنخفض حتى يتمكنوا من معرفة من يجب عليهم إنفاق معظم ميزانيتهم الإعلانية.
مثال 3: علم الرياضة
غالبًا ما يستخدم علماء بيانات الفرق الرياضية التجميع لتحديد اللاعبين المتشابهين.
على سبيل المثال، قد تقوم فرق كرة السلة المحترفة بجمع معلومات اللاعب التالية:
- نقاط لكل لعبة
- المرتدات لكل مباراة
- تمريرات حاسمة في كل مباراة
- يسرق في كل لعبة
يمكنهم بعد ذلك إدخال هذه المتغيرات في خوارزمية تجميع لتحديد اللاعبين المتشابهين حتى يتمكنوا من تدريبهم مع بعضهم البعض وإجراء تدريبات محددة بناءً على نقاط القوة والضعف لديهم.
مثال 4: التسويق عبر البريد الإلكتروني
تستخدم العديد من الشركات التحليل العنقودي لتحديد المستهلكين المتشابهين حتى يتمكنوا من تخصيص رسائل البريد الإلكتروني المرسلة إلى المستهلكين بطريقة تزيد الإيرادات إلى الحد الأقصى.
على سبيل المثال، قد تقوم الشركة بجمع المعلومات التالية عن المستهلكين:
- نسبة رسائل البريد الإلكتروني المفتوحة
- عدد النقرات لكل بريد إلكتروني
- الوقت الذي يقضيه في التحقق من رسائل البريد الإلكتروني
باستخدام هذه المقاييس، يمكن للشركة إجراء تحليل جماعي لتحديد المستهلكين الذين يستخدمون البريد الإلكتروني بطرق مماثلة وتخصيص أنواع رسائل البريد الإلكتروني وتكرار رسائل البريد الإلكتروني التي يرسلونها إلى مجموعات مختلفة من العملاء.
مثال 5: التأمين الصحي
غالبًا ما يستخدم الخبراء الاكتواريون في شركات التأمين الصحي التحليل العنقودي لتحديد “مجموعات” المستهلكين الذين يستخدمون تأمينهم الصحي بطرق محددة.
على سبيل المثال، قد يقوم الخبير الاكتواري بجمع المعلومات التالية عن الأسر:
- إجمالي عدد زيارات الطبيب سنويًا
- إجمالي حجم الأسرة
- إجمالي عدد الأمراض المزمنة لكل أسرة
- متوسط عمر أفراد الأسرة
يمكن للخبير الاكتواري بعد ذلك إدخال هذه المتغيرات في خوارزمية تجميعية لتحديد الأسر المماثلة. يمكن لشركة التأمين الصحي بعد ذلك تحديد أقساط شهرية بناءً على عدد المرات التي تتوقع فيها أن تستخدم الأسر في مجموعات معينة تأمينها.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية إجراء أنواع مختلفة من التحليلات العنقودية باستخدام لغات البرمجة الإحصائية:
كيفية تنفيذ مجموعة K-Means في بايثون
كيفية إجراء تجميع K-Means في R
كيفية إجراء مجموعات K-Medoids في R
كيفية إجراء التجميع الهرمي في R