كيفية تفسير قيم احتمالية السجل (مع أمثلة)


تعد قيمة احتمالية السجل لنموذج الانحدار طريقة لقياس مدى ملاءمة النموذج. كلما زادت قيمة احتمالية السجل، كلما كان النموذج مناسبًا لمجموعة البيانات بشكل أفضل.

يمكن أن تتراوح قيمة احتمالية السجل لنموذج معين من اللانهاية السالبة إلى اللانهاية الإيجابية. إن قيمة احتمالية السجل الفعلية لنموذج معين لا معنى لها بشكل عام، ولكنها مفيدة لمقارنة نموذجين أو أكثر .

من الناحية العملية، غالبًا ما نلائم نماذج الانحدار المتعددة مع مجموعة بيانات ونختار النموذج ذو أعلى قيمة لاحتمالية السجل باعتباره النموذج الذي يناسب البيانات بشكل أفضل.

يوضح المثال التالي كيفية تفسير قيم احتمالية السجل لنماذج الانحدار المختلفة في الممارسة العملية.

مثال: تفسير قيم احتمالية السجل

لنفترض أن لدينا مجموعة البيانات التالية التي توضح عدد غرف النوم وعدد الحمامات وأسعار مبيعات 20 منزلًا مختلفًا في حي معين:

لنفترض أننا نريد ملاءمة نموذجي الانحدار التاليين وتحديد أيهما يوفر أفضل ملاءمة للبيانات:

النموذج 1 : السعر = β 0 + β 1 (عدد الغرف)

النموذج 2 : السعر = β0 + β1 (عدد الحمامات)

يوضح الكود التالي كيفية ملاءمة كل نموذج انحدار وحساب قيمة احتمالية السجل لكل نموذج في R:

 #define data
df <- data. frame (beds=c(1, 1, 1, 2, 2, 2, 2, 3, 3, 3,
                        3, 3, 3, 3, 4, 4, 4, 5, 5, 6),
                 baths=c(2, 1, 4, 3, 2, 2, 3, 5, 4, 3,
                         4, 4, 3, 4, 2, 4, 3, 5, 6, 7),
                 price=c(120, 133, 139, 185, 148, 160, 192, 205, 244, 213,
                         236, 280, 275, 273, 312, 311, 304, 415, 396, 488))

#fitmodels
model1 <- lm(price~beds, data=df)
model2 <- lm(price~baths, data=df)

#calculate log-likelihood value of each model
logLik(model1)

'log Lik.' -91.04219 (df=3)

logLik(model2)

'log Lik.' -111.7511 (df=3)

يحتوي النموذج الأول على قيمة احتمالية سجل أعلى ( -91.04 ) من النموذج الثاني ( -111.75 )، مما يعني أن النموذج الأول يوفر ملاءمة أفضل للبيانات.

احتياطات لاستخدام قيم احتمالية السجل

عند حساب قيم احتمالية السجل، من المهم ملاحظة أن إضافة متغيرات توقع إضافية إلى النموذج سيؤدي دائمًا تقريبًا إلى زيادة قيمة احتمالية السجل، حتى لو لم تكن متغيرات التوقع الإضافية ذات دلالة إحصائية.

هذا يعني أنه يجب عليك فقط مقارنة قيم احتمالية السجل بين نموذجي الانحدار إذا كان كل نموذج يحتوي على نفس عدد متغيرات التوقع.

لمقارنة النماذج بأعداد مختلفة من متغيرات التوقع، يمكنك إجراء اختبار نسبة الاحتمالية لمقارنة مدى ملاءمة نموذجي الانحدار المتداخلين.

مصادر إضافية

كيفية استخدام الدالة lm() لتناسب النماذج الخطية في R
كيفية إجراء اختبار نسبة الاحتمالية في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *