كيفية تحديد المتغيرات الهامة في نماذج الانحدار
أحد الأسئلة الرئيسية التي ستطرحها على نفسك بعد تركيب نموذج الانحدار الخطي المتعدد هو: ما هي المتغيرات المهمة؟
هناك طريقتان لا ينبغي عليك استخدامهما لتحديد معنى المتغير:
1. قيمة معاملات الانحدار
يخبرك معامل الانحدار لمتغير متنبئ معين بمتوسط التغير في متغير الاستجابة المرتبط بزيادة وحدة واحدة في متغير المتنبئ هذا.
ومع ذلك، عادة ما يتم قياس كل متغير متوقع في النموذج على مقياس مختلف. ولذلك ليس من المنطقي مقارنة القيم المطلقة لمعاملات الانحدار لتحديد المتغيرات الأكثر أهمية.
2. القيم p لمعاملات الانحدار
يمكن للقيم p لمعاملات الانحدار أن تخبرك ما إذا كان متغير توقع معين له ارتباط ذو دلالة إحصائية مع متغير الاستجابة، لكنها لا تستطيع أن تخبرك ما إذا كان متغير توقع معين مهمًا عمليًا في العالم الحقيقي.
يمكن أن تكون قيم P منخفضة أيضًا بسبب حجم العينة الكبير أو التباين المنخفض، وهو ما لا يخبرنا في الواقع ما إذا كان متغير التوقع المحدد ذا معنى في الممارسة أم لا.
ومع ذلك، هناك طريقتان يجب عليك استخدامهما لتحديد معنى المتغيرات:
1. معاملات الانحدار الموحدة
عادةً، عندما نقوم بإجراء انحدار خطي متعدد، فإن معاملات الانحدار الناتجة في مخرجات النموذج ليست موحدة ، مما يعني أنها تستخدم البيانات الأولية للعثور على الخط الأكثر ملائمة.
ومع ذلك، من الممكن توحيد كل متغير متنبئ ومتغير الاستجابة (عن طريق طرح القيمة المتوسطة لكل متغير من القيم الأصلية ثم قسمتها على الانحراف المعياري للمتغيرات) ثم إجراء الانحدار، مما يؤدي إلى معاملات الانحدار الموحدة .
ومن خلال توحيد كل متغير في النموذج، يتم قياس كل متغير على نفس المقياس. ولذلك فمن المنطقي مقارنة القيم المطلقة لمعاملات الانحدار في النتائج لفهم المتغيرات التي لها التأثير الأكبر على متغير الاستجابة.
2. الخبرة في الموضوع
على الرغم من أن القيم p يمكن أن تخبرك ما إذا كان هناك تأثير ذو دلالة إحصائية بين متغير متنبئ معين ومتغير الاستجابة، إلا أن الخبرة الموضوعية مطلوبة لتأكيد ما إذا كان متغير المتنبئ ذا صلة بالفعل ويجب تضمينه بالفعل في النموذج.
يوضح المثال التالي كيفية تحديد المتغيرات المهمة في نموذج الانحدار عمليًا.
مثال: كيفية تحديد المتغيرات المهمة في نموذج الانحدار
لنفترض أن لدينا مجموعة البيانات التالية التي تحتوي على معلومات حول العمر والقدم المربع وسعر البيع لـ 12 منزلًا:
لنفترض أننا قمنا بعد ذلك بإجراء انحدار خطي متعدد، باستخدام العمر والمساحة المربعة كمتغيرات متوقعة والسعر كمتغير الاستجابة.
نحصل على النتيجة التالية:
معاملات الانحدار في هذا الجدول ليست موحدة ، مما يعني أنهم استخدموا البيانات الأولية لتناسب نموذج الانحدار هذا.
للوهلة الأولى، يبدو أن العمر له تأثير أكبر بكثير على أسعار العقارات حيث أن معامله في جدول الانحدار هو -409.833 ، مقارنة بـ 100.866 فقط للمتر المربع المتغير المتنبئ.
ومع ذلك، فإن الخطأ المعياري أكبر بكثير بالنسبة للعمر منه بالنسبة للقدم المربع، ولهذا السبب تكون القيمة p المقابلة كبيرة بالفعل بالنسبة للعمر (ع = 0.520) وصغيرة بالنسبة لمربعات القدم المربع (ع = 0.000).
ويرجع سبب الاختلاف الشديد في معاملات الانحدار إلى الاختلاف الشديد في المقاييس للمتغيرين:
- تتراوح القيم للعمر من 4 إلى 44 عامًا.
- تتراوح قيم اللقطات المربعة من 1200 إلى 2800.
لنفترض أننا قمنا بتطبيع البيانات الأولية بدلاً من ذلك:
إذا قمنا بعد ذلك بإجراء انحدار خطي متعدد باستخدام البيانات الموحدة، فسنحصل على نتيجة الانحدار التالية:
معاملات الانحدار في هذا الجدول موحدة ، مما يعني أنها استخدمت بيانات موحدة لتناسب نموذج الانحدار هذا.
وطريقة تفسير المعاملات في الجدول هي كما يلي:
- وترتبط زيادة انحراف معياري واحد في العمر بانخفاض قدره 0.092 انحراف معياري في سعر المنزل، على افتراض أن المساحة المربعة تظل ثابتة.
- وترتبط زيادة انحراف معياري واحد في القدم المربع بزيادة قدرها 0.885 انحراف معياري في سعر المنزل، على افتراض أن العمر يظل ثابتا.
يمكننا الآن أن نرى أن القدم المربعة لها تأثير أكبر بكثير على أسعار المنازل من تأثير العمر.
ملحوظة : القيم الاحتمالية لكل متغير متنبئ هي نفسها تمامًا تلك الموجودة في نموذج الانحدار السابق.
عند تحديد النموذج النهائي الذي سيتم استخدامه، نعلم الآن أن اللقطات المربعة أكثر أهمية في التنبؤ بسعر المنزل من عمره .
في نهاية المطاف، سنحتاج إلى استخدام خبرتنا في هذا الموضوع لتحديد المتغيرات التي يجب تضمينها في النموذج النهائي، بناءً على المعرفة الحالية حول أسعار المساكن والعقارات.
مصادر إضافية
توفر البرامج التعليمية التالية معلومات إضافية حول نماذج الانحدار:
كيفية قراءة وتفسير جدول الانحدار
كيفية تفسير معاملات الانحدار
كيفية تفسير القيم P في الانحدار الخطي