كيفية قراءة وتفسير جدول الانحدار


في الإحصاء، الانحدار هو أسلوب يمكن استخدامه لتحليل العلاقة بين متغيرات التوقع ومتغير الاستجابة.

عند استخدام برامج (مثل R وSAS وSPSS وما إلى ذلك) لإجراء تحليل الانحدار، سوف تتلقى كإخراج جدول انحدار يلخص نتائج الانحدار. ومن المهم معرفة كيفية قراءة هذا الجدول حتى تتمكن من فهم نتائج تحليل الانحدار.

يعرض هذا البرنامج التعليمي مثالاً لتحليل الانحدار ويقدم شرحًا تفصيليًا لكيفية قراءة وتفسير نتيجة جدول الانحدار.

مثال على الانحدار

لنفترض أن لدينا مجموعة البيانات التالية التي توضح إجمالي عدد الساعات المدروسة، وإجمالي عدد الاختبارات الإعدادية التي تم إجراؤها، ودرجة الاختبار النهائي لـ 12 طالبًا مختلفًا:

لتحليل العلاقة بين ساعات الدراسة والاختبارات الإعدادية مع درجة الامتحان النهائي التي يحصل عليها الطالب، نقوم بإجراء الانحدار الخطي المتعدد باستخدام ساعات الدراسة والامتحانات الإعدادية كمتغيرات متوقعة والدرجة النهائية قيد الامتحان كمتغير استجابة.

نحصل على النتيجة التالية:

فحص ملاءمة النموذج

يعرض القسم الأول عدة أرقام مختلفة تقيس ملاءمة نموذج الانحدار، أي مدى قدرة نموذج الانحدار على “ملاءمة” مجموعة البيانات.

إليك كيفية تفسير كل رقم من الأرقام في هذا القسم:

عدة روبية

هذا هو معامل الارتباط . يقيس قوة العلاقة الخطية بين متغيرات التوقع ومتغير الاستجابة. يشير مضاعف R لـ 1 إلى علاقة خطية مثالية بينما يشير مضاعف R لـ 0 إلى عدم وجود علاقة خطية. مضاعف R هو الجذر التربيعي لـ R تربيع (انظر أدناه).

في هذا المثال يكون المضاعف R هو 0.72855 مما يدل على وجود علاقة خطية قوية إلى حد ما بين ساعات الدراسة والامتحانات التحضيرية للمتنبئين ودرجة الامتحان النهائي لمتغير الاستجابة.

R-مربع

غالبًا ما يُكتب هذا بالرمز r2 ويُعرف أيضًا بمعامل التحديد . هذه هي نسبة التباين في متغير الاستجابة التي يمكن تفسيرها بواسطة المتغير المتنبئ.

يمكن أن تتراوح قيمة R-squared من 0 إلى 1. وتشير القيمة 0 إلى أنه لا يمكن تفسير متغير الاستجابة بواسطة متغير التوقع على الإطلاق. تشير القيمة 1 إلى أنه يمكن تفسير متغير الاستجابة بشكل مثالي دون أخطاء بواسطة متغير التوقع.

في هذا المثال، مربع R هو 0.5307 ، مما يشير إلى أن 53.07% من التباين في درجات الاختبار النهائي يمكن تفسيره بعدد ساعات الدراسة وعدد الاختبارات التدريبية السابقة.

ذات صلة: ما هي قيمة R-squared الجيدة؟

تم تعديل مربع R

هذه نسخة معدلة من R-squared والتي تم تعديلها بناءً على عدد المتنبئين في النموذج. وهو دائمًا أقل من R تربيع. يمكن أن يكون R-squared المعدل مفيدًا لمقارنة ملاءمة نماذج الانحدار المختلفة مع بعضها البعض.

في هذا المثال، مربع R المعدل هو 0.4265.

الخطأ القياسي للانحدار

الخطأ القياسي للانحدار هو متوسط المسافة بين القيم المرصودة وخط الانحدار. في هذا المثال، تنحرف القيم المرصودة في المتوسط بمقدار 7.3267 وحدة عن خط الانحدار.

ذات صلة: فهم الخطأ القياسي للانحدار

تعليقات

هذا هو ببساطة عدد الملاحظات في مجموعة البيانات لدينا. في هذا المثال، العدد الإجمالي للملاحظات هو 12 .

اختبار الأهمية الشاملة لنموذج الانحدار

يوضح القسم التالي درجات الحرية ومجموع المربعات ومتوسط المربعات وإحصائيات F والأهمية الإجمالية لنموذج الانحدار.

إليك كيفية تفسير كل رقم من الأرقام في هذا القسم:

درجات الانحدار من الحرية

وهذا العدد يساوي: عدد معاملات الانحدار – 1. في هذا المثال لدينا حد أصلي ومتغيرين متنبئين، وبذلك يكون لدينا ثلاثة معاملات انحدار إجمالاً، مما يعني أن درجات حرية الانحدار هي 3 – 1 = 2 .

مجموع درجات الحرية

هذا العدد يساوي: عدد الملاحظات – 1. في هذا المثال لدينا 12 ملاحظة، وبالتالي فإن العدد الإجمالي لدرجات الحرية هو 12 – 1 = 11 .

درجات الحرية المتبقية

هذا الرقم يساوي: إجمالي df – انحدار df. في هذا المثال، درجات الحرية المتبقية هي 11 – 2 = 9 .

يعني المربعات

يتم حساب مربعات الانحدار المتوسطة بواسطة انحدار SS/انحدار df. في هذا المثال، الانحدار MS = 546.53308 / 2 = 273.2665 .

يتم حساب المربعات المتوسطة المتبقية بواسطة SS/df المتبقي. في هذا المثال، MS المتبقية = 483.1335 / 9 = 53.68151 .

إحصائية ف

يتم حساب إحصائية f على أنها انحدار MS/MS المتبقية. تشير هذه الإحصائية إلى ما إذا كان نموذج الانحدار يوفر ملاءمة أفضل للبيانات من النموذج الذي لا يحتوي على متغيرات مستقلة.

في الأساس، فهو يختبر ما إذا كان نموذج الانحدار ككل مفيدًا. بشكل عام، إذا لم يكن أي من متغيرات التوقع في النموذج ذا دلالة إحصائية، فإن إحصائية F الإجمالية ليست ذات دلالة إحصائية أيضًا.

في هذا المثال، إحصائية F هي 273.2665 / 53.68151 = 5.09 .

أهمية F (قيمة P)

القيمة الأخيرة في الجدول هي القيمة p المرتبطة بإحصائيات F. لمعرفة ما إذا كان نموذج الانحدار العام مهمًا، يمكنك مقارنة القيمة الاحتمالية بمستوى الأهمية؛ الاختيارات الشائعة هي .01 و.05 و.10.

إذا كانت القيمة p أقل من مستوى الأهمية، فهناك أدلة كافية لاستنتاج أن نموذج الانحدار يناسب البيانات بشكل أفضل من النموذج الذي لا يحتوي على متغير متنبئ. هذه النتيجة إيجابية لأنها تعني أن المتغيرات المتوقعة للنموذج تعمل بالفعل على تحسين ملاءمة النموذج.

في هذا المثال، القيمة p هي 0.033 ، وهي أقل من مستوى الأهمية المشترك البالغ 0.05. ويشير ذلك إلى أن نموذج الانحدار ككل ذو دلالة إحصائية، أي أن النموذج يناسب البيانات بشكل أفضل من النموذج الذي لا يحتوي على متغيرات تنبؤية.

اختبار الأهمية الشاملة لنموذج الانحدار

يعرض القسم الأخير تقديرات المعامل، والخطأ المعياري للتقديرات، وإحصائية t، والقيم p، وفترات الثقة لكل مصطلح في نموذج الانحدار.

إليك كيفية تفسير كل رقم من الأرقام في هذا القسم:

المعاملات

تعطينا المعاملات الأرقام اللازمة لكتابة معادلة الانحدار المقدرة:

قبعة ص = ب 0 + ب 1 × 1 + ب 2 × 2 .

في هذا المثال، معادلة الانحدار المقدرة هي:

درجة الامتحان النهائي = 66.99 + 1.299 (ساعات الدراسة) + 1.117 (الاختبارات التحضيرية)

يتم تفسير كل معامل فردي على أنه متوسط الزيادة في متغير الاستجابة لكل زيادة بمقدار وحدة واحدة في متغير متنبئ معين، على افتراض أن جميع المتغيرات المتوقعة الأخرى تظل ثابتة. على سبيل المثال، لكل ساعة إضافية تتم دراستها، يبلغ متوسط الزيادة المتوقعة في درجة الاختبار النهائي 1,299 نقطة، على افتراض أن عدد الاختبارات الإعدادية التي تم إجراؤها يظل ثابتًا.

يتم تفسير التقاطع على أنه متوسط الدرجة المتوقعة في الامتحان النهائي للطالب الذي يدرس لمدة صفر ساعة ولا يقدم أي امتحانات تحضيرية. في هذا المثال، من المتوقع أن يحصل الطالب على 66.99 إذا درس لمدة صفر ساعة ولم يتقدم لأي اختبارات إعدادية. كن حذرًا عند تفسير تقاطع نتيجة الانحدار، حيث أنه ليس من المنطقي دائمًا القيام بذلك.

على سبيل المثال، في بعض الحالات، قد يتبين أن التقاطع هو رقم سالب، والذي غالبًا لا يكون له تفسير واضح. هذا لا يعني أن النموذج خاطئ، بل يعني فقط أن الاعتراض نفسه لا ينبغي تفسيره على أنه يعني أي شيء.

الخطأ المعياري وإحصائيات t والقيم p

الخطأ المعياري هو مقياس لعدم اليقين حول تقدير المعامل لكل متغير.

إن t-stat هو ببساطة المعامل مقسومًا على الخطأ المعياري. على سبيل المثال، T-stat لساعات الدراسة هو 1.299 / 0.417 = 3.117.

يعرض العمود التالي القيمة p المرتبطة بـ t-stat. يخبرنا هذا الرقم ما إذا كان متغير الاستجابة المحدد مهمًا في النموذج. في هذا المثال، نرى أن القيمة الاحتمالية لساعات الدراسة هي 0.012 والقيمة الاحتمالية للامتحانات الإعدادية هي 0.304. وهذا يشير إلى أن ساعات الدراسة تعد مؤشرا هاما لدرجة الامتحان النهائي، على عكس الامتحانات التدريبية .

فاصل الثقة لتقديرات المعامل

يوفر العمودان الأخيران من الجدول الحدود الدنيا والعليا لفاصل ثقة 95% لتقديرات المعامل.

على سبيل المثال، معامل تقدير ساعات الدراسة هو 1.299، ولكن هناك بعض عدم اليقين حول هذا التقدير. لا يمكننا أبدًا أن نعرف على وجه اليقين ما إذا كان هذا هو المعامل الدقيق. لذا فإن فاصل الثقة 95% يمنحنا نطاقًا من القيم المحتملة للمعامل الحقيقي.

وفي هذه الحالة تكون فترة الثقة 95% لساعات الدراسة (0.356، 2.24). لاحظ أن فترة الثقة هذه لا تحتوي على الرقم “0”، مما يعني أننا على يقين تام من أن القيمة الحقيقية لمعامل ساعات الدراسة هي غير الصفر، أي رقم موجب.

وفي المقابل فإن فترة الثقة 95% للامتحانات الإعدادية هي (-1.201، 3.436). علماً بأن فترة الثقة هذه تحتوي على الرقم “0”، مما يعني أن القيمة الحقيقية لمعامل الاختبارات التحضيرية يمكن أن تكون صفراً، أي أنها ليست ذات أهمية في التنبؤ بنتائج الامتحان النهائي.

مصادر إضافية

فهم فرضية العدم للانحدار الخطي
فهم اختبار F للأهمية الشاملة في الانحدار
كيفية الإبلاغ عن نتائج الانحدار

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *