الانحدار الخطي المتعدد

تشرح هذه المقالة ماهية الانحدار الخطي المتعدد في الإحصائيات. بالإضافة إلى ذلك، سوف تتعلم كيفية إنشاء نموذج الانحدار الخطي المتعدد وكيفية تفسيره.

ما هو الانحدار الخطي المتعدد؟

الانحدار الخطي المتعدد هو نموذج انحدار يتضمن متغيرين مستقلين أو أكثر. بمعنى آخر، الانحدار الخطي المتعدد هو نموذج إحصائي يسمح بربط العديد من المتغيرات التوضيحية خطيًا بمتغير الاستجابة.

لذلك، يتم استخدام نموذج الانحدار الخطي المتعدد للعثور على معادلة تربط بين متغيرين مستقلين أو أكثر ومتغير تابع. وبالتالي، من خلال استبدال قيمة كل متغير مستقل، يتم الحصول على تقريب لقيمة المتغير التابع.

على سبيل المثال، المعادلة y=3+6x 1 -4x 2 +7x 3 هي نموذج انحدار خطي متعدد لأنها تربط رياضيًا بين ثلاثة متغيرات مستقلة (x 1 , x 2 , x 3 ) بمسار قيمة خطي لمتغير تابع واحد (y) .

صيغة الانحدار الخطي المتعدد

معادلة نموذج الانحدار الخطي المتعدد هي y=β 01 x 12 x 2 +…+β m x m +ε.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

ذهب:

  • y

    هو المتغير التابع.

  • x_i

    هو المتغير المستقل أنا .

  • \beta_0

    هو ثابت معادلة الانحدار الخطي المتعدد.

  • \beta_i

    هو معامل الانحدار المرتبط بالمتغير

    x_i

    .

  • \bm{\varepsilon}

    هذا هو الخطأ أو المتبقي، أي الفرق بين القيمة المرصودة والقيمة المقدرة بواسطة النموذج.

  • m

    هو العدد الإجمالي للمتغيرات في النموذج.

لذلك إذا كان لدينا عينة بإجمالي

n

يمكننا اقتراح نموذج الانحدار الخطي المتعدد في شكل مصفوفة:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

يمكن إعادة كتابة تعبير المصفوفة أعلاه عن طريق تخصيص حرف لكل مصفوفة:

Y=X\beta+\varepsilon

وبالتالي، ومن خلال تطبيق معيار المربعات الصغرى، من الممكن التوصل إلى صيغة تقدير معاملات نموذج الانحدار الخطي المتعدد :

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

ومع ذلك، فإن تطبيق هذه الصيغة شاق للغاية ويستغرق وقتًا طويلاً، لذلك يوصى عمليًا باستخدام برامج الكمبيوتر (مثل Minitab أو Excel) التي تسمح بتشغيل نموذج الانحدار المتعدد بسرعة أكبر.

افتراضات الانحدار الخطي المتعددة

في نموذج الانحدار الخطي المتعدد، يجب استيفاء الشروط التالية حتى يكون النموذج صالحًا:

  • الاستقلال : يجب أن تكون البقايا مستقلة عن بعضها البعض. إحدى الطرق الشائعة لضمان استقلالية النموذج هي إضافة العشوائية إلى عملية أخذ العينات.
  • التجانس : يجب أن يكون هناك تجانس في تباينات البقايا، أي أن تباين البقايا يجب أن يكون ثابتاً.
  • عدم تعدد الخطية : لا يمكن ربط المتغيرات التوضيحية المتضمنة في النموذج ببعضها البعض، أو على الأقل يجب أن تكون العلاقة بينها ضعيفة للغاية.
  • الحالة الطبيعية : يجب أن يتم توزيع البقايا بشكل طبيعي، أو بمعنى آخر، يجب أن تتبع التوزيع الطبيعي بمتوسط 0.
  • الخطية : يفترض أن العلاقة بين متغير الاستجابة والمتغيرات التوضيحية خطية.

تفسير نموذج الانحدار الخطي المتعدد

لتفسير نموذج الانحدار الخطي المتعدد، يجب أن ننظر إلى معامل التحديد (R تربيع)، والذي يعبر عن النسبة المئوية التي يوضحها نموذج الانحدار. وبالتالي كلما ارتفع معامل التحديد كلما زاد تعديل النموذج لعينة البيانات المدروسة.

ومع ذلك، فإن جودة ملاءمة النموذج الإحصائي يمكن أن تكون مضللة، خاصة في نماذج الانحدار الخطي المتعددة. لأنه عند إضافة متغير إلى النموذج يزداد معامل التحديد، حتى لو لم يكن المتغير كبيرا. ومع ذلك، فمن الضروري تعظيم معامل التحديد من خلال محاولة تقليل عدد المتغيرات، لأن النموذج أقل تعقيدًا وأسهل في التفسير.

لحل هذه المشكلة لا بد من حساب معامل التحديد المعدل (مربع R المعدل)، وهو معامل إحصائي يقيس جودة ملاءمة نموذج الانحدار، ويعاقب على كل متغير يضاف إلى النموذج، على عكس المعامل غير المعدل من العزم. وهذا لا يأخذ في الاعتبار عدد المتغيرات في النموذج.

وبالتالي، فإن معامل التحديد المعدل يسمح لنا بمقارنة مدى ملاءمة نموذجين مع عدد مختلف من المتغيرات. من حيث المبدأ، ينبغي للمرء اختيار النموذج الذي يحتوي على معامل تحديد معدل أعلى، ولكن إذا كان النموذجان لهما قيم متشابهة جدًا، فمن الأفضل اختيار النموذج الذي يحتوي على متغيرات أقل لأنه أسهل في التفسير.

وفي المقابل تشير معاملات الانحدار إلى العلاقة بين المتغير التوضيحي ومتغير الاستجابة. فإذا كان معامل الانحدار موجباً فإن متغير الاستجابة سيزداد مع زيادة المتغير التوضيحي. أما إذا كان معامل الانحدار سالباً فإن متغير الاستجابة سينخفض عند زيادة المتغير التفسيري.

منطقيا، لكي يتحقق الشرط السابق، يجب أن تظل المتغيرات الأخرى ثابتة. ولهذا السبب من المهم عدم وجود علاقة خطية متعددة بين المتغيرات التوضيحية المختلفة للنموذج. يمكنك معرفة كيفية دراسة العلاقة الخطية المتعددة للنموذج من خلال البحث عن المقالة المقابلة على موقعنا.

الانحدار الخطي المتعدد والبسيط

وأخيرا، سوف نرى ما هي الاختلافات بين نموذج الانحدار الخطي البسيط ونموذج الانحدار الخطي المتعدد، حيث أنهما نموذجان من نماذج الانحدار يستخدمان على نطاق واسع في الإحصاء.

الانحدار الخطي البسيط هو نموذج انحدار يستخدم لربط متغير مستقل. وبالتالي فإن معادلة نموذج الانحدار الخطي البسيط هي كما يلي:

y=\beta_0+\beta_1x_1+\varepsilon

ولذلك فإن الفرق بين الانحدار الخطي المتعدد والانحدار الخطي البسيط يكمن في عدد المتغيرات التوضيحية. يحتوي نموذج الانحدار الخطي المتعدد على متغيرين توضيحيين أو أكثر، بينما يحتوي نموذج الانحدار الخطي البسيط على متغير توضيحي واحد فقط.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

في الختام، الانحدار الخطي المتعدد هو امتداد للانحدار الخطي البسيط، حيث يتم ببساطة إضافة المزيد من المتغيرات التوضيحية ومعاملات الانحدار الخاصة بها. ومع ذلك، يتم حساب معاملات الانحدار بشكل مختلف، لمعرفة كيفية ذلك انقر هنا:

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *