ما هو التوزيع الثنائي؟
التوزيع الثنائي هو توزيع احتمالي ذو وضعين.
غالبًا ما نستخدم مصطلح “الوضع” في الإحصائيات الوصفية للإشارة إلى القيمة الأكثر شيوعًا في مجموعة البيانات، ولكن في هذه الحالة يشير مصطلح “الوضع” إلى الحد الأقصى المحلي في الرسم البياني.
عند عرض التوزيع الثنائي، ستلاحظ وجود “قمتين” متميزتين تمثلان هذين الوضعين.
وهذا يختلف عن التوزيع الأحادي الواسطي الذي له قمة واحدة فقط:
يمكنك أن تتذكر الفرق بين الاثنين من خلال تذكر:
- “ثنائية” = اثنان
- “المتحدون” = واحد
على الرغم من أن معظم الدورات الإحصائية تستخدم التوزيعات الأحادية مثلالتوزيع الطبيعي لشرح موضوعات مختلفة، إلا أن التوزيعات الثنائية تظهر في كثير من الأحيان في الممارسة العملية، لذلك من المفيد معرفة كيفية التعرف عليها وتفسيرها.
ملاحظة: التوزيع ثنائي الوسائط هو نوع محدد من التوزيع متعدد الوسائط .
أمثلة على التوزيعات ثنائية الوسائط
فيما يلي بعض الأمثلة على التوزيعات الثنائية:
المثال رقم 1: ساعات الذروة في المطاعم
إذا قمت بإنشاء رسم بياني لتصور توزيع العملاء بالساعة في مطعم معين، فمن المحتمل أن تجد أنه يتبع توزيعًا ثنائيًا مع ذروة خلال ساعات الغداء وقمة أخرى خلال ساعات العشاء:
المثال لا. 2: متوسط ارتفاع نوعين من النباتات
لنفترض أنك تتجول في أحد الحقول وتقيس ارتفاع النباتات المختلفة. دون أن تدرك ذلك، فإنك تقيس حجم نوعين مختلفين: أحدهما كبير جدًا والآخر صغير جدًا. إذا قمت بإنشاء رسم بياني لتصور توزيع الارتفاعات، فسيتبع توزيعًا ثنائي الشكل:
المثال رقم 3: نتائج الامتحانات
لنفترض أن المعلم يعطي امتحانًا لفصله من الطلاب. بعض الطلاب درسوا للامتحان والبعض الآخر لم يفعل. عندما يقوم المعلم بإنشاء رسم بياني لنتائج الامتحان، فإنه يتبع توزيعًا ثنائيًا مع ذروة حول الدرجات المنخفضة للطلاب الذين لم يدرسوا وقمة أخرى حول الدرجات العالية للطلاب الذين درسوا:
ما الذي يسبب التوزيعات ثنائية الوسائط؟
هناك بشكل عام شيئان يسببان التوزيعات ثنائية النسق:
1. بعض الظواهر الأساسية.
غالبًا ما تحدث التوزيعات ثنائية النسق بسبب بعض الظواهر الأساسية.
على سبيل المثال، يتبع عدد العملاء الذين يزورون مطعمًا كل ساعة توزيعًا ثنائيًا نظرًا لأن الأشخاص يميلون إلى تناول الطعام في المطاعم في وقتين مختلفين: الغداء والعشاء. هذا السلوك البشري الأساسي هو أصل التوزيع الثنائي.
2. تم تجميع مجموعتين مختلفتين معًا.
يمكن أن تحدث التوزيعات ثنائية النسق أيضًا عندما تقوم ببساطة بتحليل مجموعتين مختلفتين من الأشياء دون أن تدرك ذلك.
على سبيل المثال، إذا قمت بقياس ارتفاع النباتات في حقل معين دون أن تدرك أن نوعين مختلفين ينموان في نفس الحقل، فسوف ترى توزيعًا ثنائي الشكل عند إنشاء رسم بياني.
كيفية تحليل التوزيعات الثنائية
غالبًا ما نصف التوزيعات باستخدام المتوسط أو الوسيط لأن هذا يعطينا فكرة عن مكان “مركز” التوزيع.
لسوء الحظ، ليس من المفيد معرفة المتوسط والوسيط للتوزيع ثنائي النسق. على سبيل المثال، متوسط درجات امتحان الطلاب في المثال أعلاه هو 81:
ومع ذلك، حصل عدد قليل جدًا من الطلاب على درجات قريبة من 81. وفي هذه الحالة، يكون المتوسط مضللًا. سجل معظم الطلاب في الواقع حوالي 74 أو 88.
أفضل طريقة لتحليل وتفسير التوزيعات الثنائية هي ببساطة تقسيم البيانات إلى مجموعتين متميزتين ثم تحليل المركز والتوزيع لكل مجموعة.
على سبيل المثال، يمكننا تقسيم نتائج الامتحان إلى “درجات منخفضة” و”درجات عالية” ومن ثم إيجاد المتوسط والانحراف المعياري لكل مجموعة.
إذا كنت تشارك نتائج التحليل وتتبع بياناتك توزيعًا ثنائي النمط، فمن المفيد إنشاء رسم بياني مثل الموضح أعلاه حتى يتمكن جمهورك من رؤية بوضوح أن التوزيع له “ذروتين” متميزتين وأنه يؤدي فقط إلى من المنطقي تحليل كل قمة على حدة بدلاً من تحليلها كمجموعة بيانات كبيرة واحدة.