كيفية حساب القيم المتبقية في تحليل الانحدار
الانحدار الخطي البسيط هو أسلوب إحصائي يمكنك استخدامه لفهم العلاقة بين متغيرين، x وy.
يُعرف المتغير x بأنه متغير متوقع. المتغير الآخر y يعرف بمتغير الاستجابة .
على سبيل المثال، لنفترض أن لدينا مجموعة البيانات التالية بوزن وطول سبعة أفراد:
ليكن الوزن هو المتغير المتنبئ وليكن الارتفاع هو متغير الاستجابة.
إذا رسمنا هذين المتغيرين بيانيًا باستخدام مخطط التشتت ، مع الوزن على المحور السيني والارتفاع على المحور الصادي، فهذا هو الشكل الذي سيبدو عليه:
من مخطط التشتت يمكننا أن نرى بوضوح أنه مع زيادة الوزن، يميل الطول أيضًا إلى الزيادة، ولكن لتحديد هذه العلاقة بين الوزن والطول، نحتاج إلى استخدام الانحدار الخطي.
باستخدام الانحدار الخطي، يمكننا العثور على الخط الذي “يناسب” بياناتنا بشكل أفضل:
تتم كتابة صيغة هذا السطر الأفضل:
ŷ = ب 0 + ب 1 س
حيث ŷ هي القيمة المتوقعة لمتغير الاستجابة، وb 0 هو التقاطع، وb 1 هو معامل الانحدار، وx هي قيمة متغير التوقع.
في هذا المثال، أفضل خط مناسب هو:
الحجم = 32.783 + 0.2001*(الوزن)
كيفية حساب البقايا
لاحظ أن نقاط البيانات في مخطط التشتت الخاص بنا لا تتوافق دائمًا تمامًا مع الخط الأكثر ملاءمة:
ويسمى هذا الاختلاف بين نقطة البيانات والخط المتبقي . بالنسبة لكل نقطة بيانات، يمكننا حساب المتبقي من تلك النقطة عن طريق أخذ الفرق بين قيمتها الحقيقية والقيمة المتوقعة من خط أفضل ملائمة.
مثال 1: حساب المتبقي
على سبيل المثال، تذكر وزن وطول الأفراد السبعة في مجموعة البيانات الخاصة بنا:
الفرد الأول يزن 140 رطلاً. وارتفاعه 60 بوصة.
لمعرفة الطول المتوقع لهذا الشخص، يمكننا التعويض بوزنه في خط المعادلة الأفضل:
الحجم = 32.783 + 0.2001*(الوزن)
وبالتالي فإن الحجم المتوقع لهذا الفرد هو:
الارتفاع = 32.783 + 0.2001*(140)
الارتفاع = 60.797 بوصة
إذن، المتبقي لنقطة البيانات هذه هو 60 – 60.797 = -0.797 .
مثال 2: حساب المتبقي
يمكننا استخدام نفس العملية المستخدمة أعلاه لحساب المتبقي لكل نقطة بيانات. على سبيل المثال، دعونا نحسب المتبقي للفرد الثاني في مجموعة البيانات لدينا:
الفرد الثاني يزن 155 جنيها. وارتفاعه 62 بوصة.
لمعرفة الطول المتوقع لهذا الشخص، يمكننا التعويض بوزنه في خط المعادلة الأفضل:
الحجم = 32.783 + 0.2001*(الوزن)
وبالتالي فإن الحجم المتوقع لهذا الفرد هو:
الارتفاع = 32.783 + 0.2001*(155)
الارتفاع = 63.7985 بوصة
وبالتالي فإن المتبقي لنقطة البيانات هذه هو 62 – 63.7985 = -1.7985 .
احسب جميع البقايا
باستخدام نفس الطريقة المتبعة في المثالين السابقين، يمكننا حساب المتبقي لكل نقطة بيانات:
لاحظ أن بعض المخلفات إيجابية والبعض الآخر سلبي. إذا جمعنا كل الباقي، سيكون مجموعهم صفرًا.
وذلك لأن الانحدار الخطي يجد الخط الذي يقلل من المربع الإجمالي للبقايا، ولهذا السبب يمر الخط عبر البيانات بشكل مثالي، مع وجود بعض نقاط البيانات فوق الخط والبعض الآخر أسفل الخط.
عرض المخلفات
تذكر أن المتبقي هو ببساطة المسافة بين القيمة الفعلية للبيانات والقيمة التي تنبأ بها خط الانحدار الأفضل ملائمة. إليك ما تبدو عليه هذه المسافات بصريًا على سحابة نقطية:
لاحظ أن بعض المخلفات أكبر من غيرها. كما أن بعض المخلفات إيجابية وبعضها سلبية كما ذكرنا سابقاً.
إنشاء المسار المتبقي
الهدف من حساب القيم المتبقية هو معرفة مدى ملاءمة خط الانحدار للبيانات.
تشير المخلفات الأكبر إلى أن خط الانحدار لا يتناسب مع البيانات بشكل جيد، أي أن نقاط البيانات الفعلية لا تقارب خط الانحدار.
تشير المخلفات الأصغر إلى أن خط الانحدار يناسب البيانات بشكل أفضل، أي أن نقاط البيانات الفعلية أقرب إلى خط الانحدار.
هناك نوع مفيد من المخططات لتصور جميع البقايا مرة واحدة وهو المخطط المتبقي. المؤامرة المتبقية هي نوع من المؤامرة التي تعرض القيم المتوقعة مقابل القيم المتبقية لنموذج الانحدار.
غالبًا ما يستخدم هذا النوع من المخططات لتقييم ما إذا كان نموذج الانحدار الخطي مناسبًا لمجموعة بيانات معينة أم لا وللتحقق من عدم تجانس العناصر المتبقية.
راجع هذا البرنامج التعليمي لمعرفة كيفية إنشاء مخطط متبقي لنموذج انحدار خطي بسيط في Excel.