Cdf أو pdf: ما الفرق؟
يقدم هذا البرنامج التعليمي شرحًا بسيطًا للفرق بين PDF (دالة الكثافة الاحتمالية) وCDF (دالة التوزيع التراكمي) في الإحصائيات.
المتغيرات العشوائية
قبل أن نتمكن من تعريف ملف PDF أو CDF، نحتاج أولاً إلى فهم المتغيرات العشوائية.
المتغير العشوائي ، ويرمز له عادةً بـ X، هو متغير تكون قيمه هي النتائج العددية لعملية عشوائية. هناك نوعان من المتغيرات العشوائية: منفصلة ومستمرة.
المتغيرات العشوائية المنفصلة
المتغير العشوائي المنفصل هو متغير يمكنه فقط أن يأخذ عددًا معدودًا من القيم المميزة مثل 0، 1، 2، 3، 4، 5… 100، 1 مليون، إلخ. فيما يلي بعض الأمثلة على المتغيرات العشوائية المنفصلة:
- عدد المرات التي تهبط فيها العملة المعدنية بعد رميها 20 مرة.
- عدد المرات التي وصل فيها حجر النرد إلى الرقم 4 بعد رميه 100 مرة.
المتغيرات العشوائية المستمرة
المتغير العشوائي المستمر هو متغير يمكن أن يأخذ عددًا لا نهائيًا من القيم المحتملة. فيما يلي بعض الأمثلة على المتغيرات العشوائية المستمرة:
- ارتفاع الشخص
- وزن الحيوان
- الوقت المستغرق للمشي مسافة ميل
على سبيل المثال، يمكن أن يكون ارتفاع الشخص 60.2 بوصة، 65.2344 بوصة، 70.431222 بوصة، وما إلى ذلك. هناك عدد لا حصر له من القيم الممكنة للحجم.
القاعدة العامة: إذا كان بإمكانك حساب عدد النتائج، فأنت تعمل باستخدام متغير عشوائي منفصل (على سبيل المثال، حساب عدد المرات التي تظهر فيها العملة المعدنية على الصورة). ولكن إذا كان بإمكانك قياس النتيجة، فأنت تعمل مع متغير عشوائي مستمر (مثل القياس والطول والوزن والوقت وما إلى ذلك)
وظائف الكثافة الاحتمالية
تخبرنا دالة كثافة الاحتمال (pdf) باحتمال أن يأخذ المتغير العشوائي قيمة معينة.
على سبيل المثال، لنفترض أننا ألقينا حجر النرد مرة واحدة. إذا سمحنا لـ x بالإشارة إلى الرقم الذي هبط عليه النرد، فيمكن وصف دالة الكثافة الاحتمالية للنتيجة على النحو التالي:
ف(س < 1) : 0
ف(س = 1) : 1/6
ف(س = 2) : 1/6
ف(س = 3) : 1/6
ف(س = 4) : 1/6
ف(س = 5) : 1/6
ف(س = 6) : 1/6
ف(س > 6) : 0
لاحظ أن هذا مثال لمتغير عشوائي منفصل، حيث أن x يمكن أن تأخذ قيمًا صحيحة فقط.
بالنسبة للمتغير العشوائي المستمر، لا يمكننا استخدام ملف PDF مباشرة، لأن احتمال أن تأخذ x قيمة محددة هو صفر.
على سبيل المثال، لنفترض أننا نريد معرفة احتمال أن يكون وزن قطعة همبرغر من مطعم معين ربع رطل (0.25 رطل). وبما أن الوزن متغير مستمر، فإنه يمكن أن يأخذ عددا لا حصر له من القيم.
على سبيل المثال، قد يزن همبرغر معين في الواقع 0.250001 رطل، أو 0.24 رطل، أو 0.2488 رطل. احتمال أن يزن همبرغر معين 0.25 رطل بالضبط هو صفر.
وظائف التوزيع التراكمي
تخبرنا دالة التوزيع التراكمي (cdf) باحتمال أن يأخذ المتغير العشوائي قيمة أقل من أو تساوي x .
على سبيل المثال، لنفترض أننا ألقينا حجر النرد مرة واحدة. إذا سمحنا لـ x بالإشارة إلى الرقم الذي هبط عليه النرد، فيمكن وصف دالة التوزيع التراكمي للنتيجة على النحو التالي:
ف(س ≥ 0) : 0
ف(س ≥ 1) : 1/6
ف(س ≥ 2) : 2/6
ف(س ≥ 3) : 3/6
ف(س ≥ 4) : 4/6
ف(س ≥ 5) : 5/6
ف(س ≥ 6) : 6/6
ف(س > 6) : 0
لاحظ أن احتمال أن تكون x أقل من أو تساوي 6 هو 6/6، وهو ما يساوي 1. وذلك لأن النرد سيستقر على 1، 2، 3، 4، 5، أو 6 باحتمال 100%.
يستخدم هذا المثال متغير عشوائي منفصل، ولكن يمكن أيضًا استخدام دالة الكثافة المستمرة لمتغير عشوائي مستمر.
تتميز دوال التوزيع التراكمي بالخصائص التالية:
- احتمال أن يأخذ المتغير العشوائي قيمة أقل من أصغر قيمة ممكنة هو صفر. على سبيل المثال، احتمال سقوط حجر النرد على قيمة أقل من 1 هو صفر.
- احتمال أن يأخذ المتغير العشوائي قيمة أقل من أو تساوي أكبر قيمة ممكنة هو واحد. على سبيل المثال، احتمال سقوط حجر النرد على قيمة 1 أو 2 أو 3 أو 4 أو 5 أو 6 هو واحد. يجب أن تهبط على أحد هذه الأرقام.
- إن cdf دائمًا غير متناقص. وهذا يعني أن احتمال سقوط حجر النرد على رقم أقل من أو يساوي 1 هو 1/6، واحتمال سقوط حجر النرد على رقم أقل من أو يساوي 2 هو 2/6، واحتمال سقوط حجر النرد على رقم أقل من أو يساوي 2 هو 2/6، واحتمال سقوط حجر النرد على رقم أقل من أو يساوي 2 هو 1/6. الرقم الأصغر من أو يساوي 3 هو 3/6، إلخ. الاحتمالات التراكمية دائما غير متناقصة.
ذات صلة: يمكنك استخدام مخطط ogive لتصور دالة التوزيع التراكمي.
العلاقة بين CDF و PDF
من الناحية الفنية، دالة الكثافة الاحتمالية (pdf) هي مشتقة دالة التوزيع التراكمي (cdf).
بالإضافة إلى ذلك، فإن المساحة الموجودة أسفل منحنى ملف pdf بين اللانهاية السالبة و x تساوي قيمة x على ملف cdf.
للحصول على شرح شامل للعلاقة بين ملف pdf وcdf، بالإضافة إلى إثبات سبب كون ملف pdf مشتقًا من ملف cdf، راجع كتاب الإحصاء المدرسي.