كيفية الحصول على القيم والبقايا المتوقعة في ستاتا
الانحدار الخطي هو أسلوب يمكننا استخدامه لفهم العلاقة بين واحد أو أكثر من المتغيرات التوضيحية ومتغير الاستجابة.
عندما نقوم بإجراء الانحدار الخطي على مجموعة بيانات، ننتهي بمعادلة انحدار يمكن استخدامها للتنبؤ بقيم متغير الاستجابة، بالنظر إلى قيم المتغيرات التوضيحية.
يمكننا بعد ذلك قياس الفرق بين القيم المتوقعة والقيم الفعلية للحصول على البقايا لكل توقع. يساعدنا هذا في الحصول على فكرة عن مدى نجاح نموذج الانحدار في توقع قيم الاستجابة.
يشرح هذا البرنامج التعليمي كيفية الحصول على القيم المتوقعة والمتبقية لنموذج الانحدار في Stata.
مثال: كيفية الحصول على القيم والبقايا المتوقعة
في هذا المثال، سوف نستخدم مجموعة بيانات Stata المضمنة والتي تسمى auto . سوف نستخدم ميلا في الغالون والإزاحة كمتغيرات توضيحية والسعر كمتغير الاستجابة.
استخدم الخطوات التالية لإجراء الانحدار الخطي ثم الحصول على القيم والمتبقيات المتوقعة لنموذج الانحدار.
الخطوة 1: تحميل وعرض البيانات.
أولاً، سنقوم بتحميل البيانات باستخدام الأمر التالي:
الاستخدام التلقائي للنظام
بعد ذلك، سنحصل على ملخص سريع للبيانات باستخدام الأمر التالي:
كي تختصر
الخطوة 2: ملاءمة نموذج الانحدار.
بعد ذلك، سوف نستخدم الأمر التالي لملاءمة نموذج الانحدار:
الانحدار سعر ميلا في الغالون النزوح
معادلة الانحدار المقدرة هي:
السعر المقدر = 6672.766 -121.1833*(ميل لكل جالون) + 10.50885*(الإزاحة)
الخطوة 3: الحصول على القيم المتوقعة.
يمكننا الحصول على القيم المتوقعة باستخدام أمر التوقع وتخزين هذه القيم في متغير نسميه كما نشاء. في هذه الحالة، سوف نستخدم الاسم pred_price :
توقع pred_price
يمكننا عرض الأسعار الفعلية والأسعار المتوقعة جنبًا إلى جنب باستخدام أمر القائمة . هناك 74 قيمة متوقعة إجمالاً، لكننا سنعرض أول 10 فقط باستخدام الأمر in 1/10 :
قائمة الأسعار pred_price في 1/10
الخطوة 4: الحصول على البقايا.
يمكننا الحصول على بقايا كل تنبؤ باستخدام الأمر residuals وتخزين هذه القيم في متغير يسمى ما نريد. في هذه الحالة، سوف نستخدم الاسم resid_price :
توقع سعر الإقامة، والبقايا
يمكننا عرض السعر الفعلي والسعر المتوقع والمتبقي جنبًا إلى جنب باستخدام أمر القائمة مرة أخرى:
قائمة الأسعار pred_price resid_price في 1/10
الخطوة 5: إنشاء مخطط للقيم المتوقعة مقابل القيم المتبقية.
أخيرًا، يمكننا إنشاء مخطط مبعثر لتصور العلاقة بين القيم المتوقعة والبواقي:
التشتت reside_price pred_price
يمكننا أن نرى أنه في المتوسط تميل البقايا إلى الزيادة مع زيادة القيم المجهزة. قد يكون هذا علامة على عدم تجانس الاستجابة – عندما لا يكون توزيع البقايا ثابتًا عند كل مستوى استجابة.
يمكننا إجراء اختبار رسمي للتغايرية باستخدام اختبار Breusch-Pagan ومعالجة ذلك باستخدام الأخطاء القياسية القوية .