ما هو التوزيع الشرطي في الإحصاء؟
إذا كان X و Y متغيرين عشوائيين موزعين بشكل مشترك، فإن التوزيع الشرطي لـ Y بالنظر إلى X هو التوزيع الاحتمالي لـ Y عندما تكون X معروفة بأنها قيمة معينة.
على سبيل المثال، يوضح الجدول المزدوج التالي نتائج استطلاع سأل 100 شخص عن الرياضة التي يفضلونها: البيسبول أو كرة السلة أو كرة القدم.
إذا أردنا معرفة احتمال تفضيل شخص لرياضة معينة مع العلم أنه رجل، فهذا مثال للتوزيع المشروط.
قيمة أحد المتغيرات العشوائية معروفة (الشخص رجل)، لكن قيمة المتغير العشوائي الآخر غير معروفة (لا نعرف رياضته المفضلة).
للعثور على التوزيع المشروط للتفضيلات الرياضية بين الرجال، سننظر ببساطة إلى قيم الخط للرجال في الجدول:
سيتم حساب التوزيع المشروط على النحو التالي:
- الرجال الذين يفضلون لعبة البيسبول: 13/48 = 0.2708
- الرجال الذين يفضلون كرة السلة: 15/48 = 0.3125
- الرجال الذين يفضلون كرة القدم: 20/48 = 0.4167
لاحظ أن مجموع الاحتمالات هو 1: 13/48 + 15/48 + 20/48 = 48/48 = 1.
يمكننا استخدام هذا التوزيع الشرطي للإجابة على أسئلة مثل: إذا كان الفرد ذكرًا، فما احتمال أن تكون لعبة البيسبول هي رياضته المفضلة؟
من التوزيع الشرطي الذي حسبناه سابقًا، يمكننا أن نرى أن الاحتمال هو 0.2708 .
من الناحية الفنية، عندما نحسب التوزيع الشرطي، نقول إننا مهتمون بمجموعة سكانية فرعية معينة من إجمالي السكان. كانت المجموعة السكانية الفرعية في المثال السابق مكونة من الرجال:
وعندما نريد حساب احتمال مرتبط بهذه المجموعة السكانية الفرعية، نقول إننا مهتمون بشخصية معينة محل اهتمام . الشخصية المثيرة للاهتمام في المثال السابق كانت لعبة البيسبول:
للعثور على احتمال ظهور سمة الاهتمام في المجموعة السكانية الفرعية، نقوم ببساطة بتقسيم قيمة سمة الاهتمام (على سبيل المثال 13) على إجمالي قيم المجموعة السكانية الفرعية (على سبيل المثال 48) للحصول على 13/48 = 0.2708 .
التوزيعات المشروطة والاستقلال
يمكننا القول أن المتغيرين العشوائيين X و Y مستقلان إذا وفقط إذا كان التوزيع الشرطي لـ Y المعطى X ، لجميع الإنجازات الممكنة لـ X ، مساويًا للتوزيع غير المشروط لـ Y.
على سبيل المثال، في الجدول السابق، هل يمكننا أن نرى أن اختباري “يفضل البيسبول” و”الذكور” مستقلان؟
للإجابة على هذا السؤال دعونا نحسب الاحتمالات التالية:
- P (يفضل لعبة البيسبول)
- P(يفضل لعبة البيسبول | رجل) “يفضل لعبة البيسبول، نظرًا لأنهم رجال
احتمال أن يفضل فرد معين لعبة البيسبول هو:
- P (يفضل لعبة البيسبول) = 36/100 = 0.36 .
احتمال أن يفضل فرد ما لعبة البيسبول، نظرًا لأنه رجل، هو
- P (يفضل لعبة البيسبول | الرجل) = 13/48 = 0.2708 .
نظرًا لأن P(يفضل البيسبول) لا يساوي P(يفضل البيسبول | ذكر)، فإن المتغيرات العشوائية لتفضيل الرياضة والجنس ليست مستقلة.
لماذا استخدام التوزيعات الشرطية؟
تعتبر التوزيعات الاحتمالية المشروطة مفيدة لأننا غالبًا ما نجمع بيانات لمتغيرين (مثل الجنس والتفضيلات الرياضية)، لكننا نريد الإجابة على أسئلة حول الاحتمالية عندما نعرف قيمة أحد المتغيرات.
في المثال السابق، أخذنا في الاعتبار السيناريو الذي عرفنا فيه أن فردًا معينًا كان ذكرًا وأردنا ببساطة معرفة احتمال تفضيل هذا الفرد للعبة البيسبول.
هناك العديد من الحالات في الحياة الواقعية حيث نعرف قيمة متغير ويمكننا استخدام التوزيع الشرطي للعثور على احتمال أن يأخذ متغير آخر قيمة معينة.
مصادر إضافية
ما هو التوزيع الهامشي؟
ما هو التوزيع الاحتمالي المشترك؟
كيفية العثور على التكرار النسبي المشروط في جدول الإدخال المزدوج