كيفية عمل تنبؤات باستخدام الانحدار الخطي
الانحدار الخطي هو أسلوب يمكننا استخدامه لقياس العلاقة بين واحد أو أكثر من متغيرات التوقع ومتغير الاستجابة .
أحد الأسباب الأكثر شيوعًا لتركيب نموذج الانحدار هو استخدام النموذج للتنبؤ بقيم الملاحظات الجديدة.
نستخدم الخطوات التالية لإجراء تنبؤات باستخدام نموذج الانحدار:
- الخطوة 1: جمع البيانات.
- الخطوة 2: ملاءمة نموذج الانحدار للبيانات.
- الخطوة 3: التحقق من أن النموذج يناسب البيانات.
- الخطوة 4: استخدم معادلة الانحدار المجهزة للتنبؤ بقيم الملاحظات الجديدة.
توضح الأمثلة التالية كيفية استخدام نماذج الانحدار لإجراء التنبؤات.
المثال 1: إجراء التنبؤات باستخدام نموذج الانحدار الخطي البسيط
لنفترض أن الطبيب يجمع بيانات عن الطول (بالبوصة) والوزن (بالجنيه) لـ 50 مريضًا.
ثم يناسب نموذج الانحدار الخطي البسيط باستخدام “الوزن” كمتغير متوقع و”الارتفاع” كمتغير الاستجابة.
معادلة الانحدار المجهزة هي:
الحجم = 32.7830 + 0.2001*(الوزن)
وبعد التحقق من استيفاء فرضيات نموذج الانحدار الخطي، يخلص الطبيب إلى أن النموذج يناسب البيانات بشكل جيد.
ويمكن بعد ذلك استخدام النموذج للتنبؤ بطول المرضى الجدد بناءً على وزنهم.
على سبيل المثال، لنفترض أن مريضًا جديدًا يزن 170 رطلاً. باستخدام النموذج، نتوقع أن يبلغ طول هذا المريض 66.8 بوصة:
الارتفاع = 32.7830 + 0.2001*(170) = 66.8 بوصة
مثال 2: عمل تنبؤات باستخدام نموذج الانحدار الخطي المتعدد
يفترض أن أحد الاقتصاديين يجمع بيانات عن إجمالي سنوات التعليم، وساعات العمل الأسبوعية، والدخل السنوي لـ 30 شخصًا.
ثم يناسب نموذج الانحدار الخطي المتعدد باستخدام “إجمالي سنوات التعليم” و”ساعات العمل الأسبوعية” كمتغير متوقع و”الدخل السنوي” كمتغير الاستجابة.
معادلة الانحدار المجهزة هي:
الدخل = 1,342.29 + 3,324.33*(سنوات الدراسة) + 765.88*(ساعات العمل الأسبوعية)
وبعد التحقق من استيفاء افتراضات نموذج الانحدار الخطي، يخلص الخبير الاقتصادي إلى أن النموذج يناسب البيانات بشكل جيد.
ويمكنه بعد ذلك استخدام النموذج للتنبؤ بالدخل السنوي للفرد الجديد بناءً على إجمالي سنوات التعليم وساعات العمل الأسبوعية.
على سبيل المثال، لنفترض أن الفرد الجديد لديه 16 عامًا من التعليم إجمالاً ويعمل بمعدل 40 ساعة في الأسبوع. باستخدام النموذج، نتوقع أن يكون لهذا الشخص دخل سنوي قدره 85,166.77 دولارًا:
الدخل = 1,342.29 + 3,324.33*(16) + 765.88*(45) = 85,166.77 دولار
حول استخدام فترات الثقة
عند استخدام نموذج الانحدار لإجراء تنبؤات حول الملاحظات الجديدة، فإن القيمة التي تنبأ بها نموذج الانحدار تسمى تقدير النقطة .
على الرغم من أن تقدير النقاط يمثل أفضل تقدير لدينا لقيمة الملاحظة الجديدة، فمن غير المرجح أن يتطابق تمامًا مع قيمة الملاحظة الجديدة.
لذا، لالتقاط حالة عدم اليقين هذه، يمكننا إنشاء فاصل ثقة – مجموعة من القيم التي من المحتمل أن تحتوي على معلمة مجتمعية بمستوى معين من الثقة.
على سبيل المثال، بدلاً من التنبؤ بأن الفرد الجديد سيكون طوله 66.8 بوصة، يمكننا إنشاء فترة الثقة التالية:
فاصل الثقة 95% = [64.8 بوصة، 68.8 بوصة]
سوف نفسر هذا الفاصل الزمني على أنه يعني أننا متأكدون بنسبة 95% من أن الارتفاع الفعلي لهذا الفرد يتراوح بين 64.8 بوصة و68.8 بوصة.
الاحتياطات الواجب اتخاذها عند إجراء التنبؤات
ضع النقاط التالية في الاعتبار عند استخدام نموذج الانحدار لإجراء التنبؤات:
1. استخدم النموذج فقط لإجراء تنبؤات ضمن نطاق البيانات المستخدمة لتقدير نموذج الانحدار.
على سبيل المثال، لنفترض أننا كنا نلائم نموذج الانحدار باستخدام المتغير المتنبئ “الوزن” وكان وزن الأفراد في العينة التي استخدمناها لتقدير النموذج يتراوح بين 120 و180 رطلاً.
لن يكون صالحاً استخدام النموذج لتقدير ارتفاع فرد يزن 200 رطل، لأن هذا يقع خارج نطاق المتغير المتنبئ الذي استخدمناه لتقدير النموذج.
من الممكن أن تختلف العلاقة بين الوزن والطول خارج نطاق 120 إلى 180 رطلاً. ولذلك لا ينبغي لنا أن نستخدم النموذج لتقدير ارتفاع فرد يزن 200 رطل.
2. استخدم النموذج فقط لعمل تنبؤات للسكان الذين أخذت عينات منهم.
على سبيل المثال، لنفترض أن عدد السكان الذي يسحبه خبير اقتصادي من عينة من جميع الأشخاص الذين يعيشون في مدينة معينة.
يجب علينا فقط استخدام نموذج الانحدار الملائم للتنبؤ بالدخل السنوي للأفراد في هذه المدينة حيث أن العينة بأكملها المستخدمة لتناسب النموذج تعيش في هذه المدينة.
مصادر إضافية
مقدمة إلى الانحدار الخطي البسيط
مقدمة في الانحدار الخطي المتعدد
مقدمة لفترات الثقة
الافتراضات الأربعة للانحدار الخطي