ما هي قيمة r-squared الجيدة؟


يقيس R-squared مدى ملاءمة نموذج الانحدار الخطي لمجموعة البيانات. يُطلق عليه أيضًا معامل التحديد ، ومربع R هو نسبة التباين في متغير الاستجابة التي يمكن تفسيرها بواسطة المتغير المتوقع.

يمكن أن تتراوح قيمة R-squared من 0 إلى 1. وتشير القيمة 0 إلى أنه لا يمكن تفسير متغير الاستجابة بواسطة متغير التوقع على الإطلاق. تشير القيمة 1 إلى أنه يمكن تفسير متغير الاستجابة بشكل مثالي دون أخطاء بواسطة متغير التوقع.

من الناحية العملية، ربما لن ترى أبدًا قيمة 0 أو 1 لـ R-squared. بدلاً من ذلك، من المحتمل أن تواجه قيمة بين 0 و1.

على سبيل المثال، لنفترض أن لديك مجموعة بيانات تحتوي على حجم السكان وعدد بائعي الزهور في 30 مدينة مختلفة. يمكنك ملاءمة نموذج انحدار خطي بسيط مع مجموعة البيانات، باستخدام حجم السكان كمتغير متوقع وبائعي الزهور كمتغير الاستجابة. في نتيجة نتائج الانحدار ترى أن R 2 = 0.2. ويشير هذا إلى أن 20% من التباين في عدد بائعي الزهور يمكن تفسيره بحجم السكان.

وهذا يقودنا إلى سؤال مهم: هل هذه قيمة “جيدة” لـ R-squared؟

تعتمد الإجابة على هذا السؤال على هدفك من نموذج الانحدار. لمعرفة:

1. هل ترغب في شرح العلاقة بين المتنبئ (المتنبئين) ومتغير الاستجابة؟

ذهب

2. هل تريد التنبؤ بمتغير الاستجابة؟

اعتمادا على الهدف، فإن الإجابة على السؤال “ما هي القيمة الجيدة لـ R تربيع؟” ” سوف تكون مختلفة.

اشرح العلاقة بين المتنبئ (المتنبئين) ومتغير الاستجابة

إذا كان هدفك الأساسي لنموذج الانحدار الخاص بك هو شرح العلاقة بين المتنبئ (المتنبئين) ومتغير الاستجابة، فإن مربع R يكون غير ذي صلة تقريبًا.

على سبيل المثال، لنفترض في مثال الانحدار أعلاه أنك ترى أن معامل الحجم السكاني المتوقع هو 0.005 وهو ذو دلالة إحصائية. وهذا يعني أن زيادة عدد السكان بمقدار واحد ترتبط بمتوسط زيادة قدرها 0.005 في عدد بائعي الزهور في مدينة معينة. بالإضافة إلى ذلك، يعد حجم السكان مؤشرًا ذا دلالة إحصائية لعدد بائعي الزهور في المدينة.

ما إذا كانت قيمة R-squared لنموذج الانحدار هذا هي 0.2 أو 0.9 لا يغير هذا التفسير. نظرًا لأنك مهتم ببساطة بالعلاقة بين حجم السكان وعدد بائعي الزهور، فلا داعي للقلق كثيرًا بشأن قيمة مربع R للنموذج.

توقع متغير الاستجابة

إذا كان هدفك الأساسي هو التنبؤ بدقة بقيمة متغير الاستجابة باستخدام متغير التوقع، فإن R-squared مهم.

بشكل عام، كلما كانت قيمة R-squared أكبر، زادت دقة متغيرات التوقع في التنبؤ بقيمة متغير الاستجابة.

تعتمد القيمة المطلوبة لقيمة R-squared على الدقة التي تحتاجها. على سبيل المثال، في الدراسات العلمية، قد يكون من الضروري أن يكون R-squared أكبر من 0.95 حتى يعتبر نموذج الانحدار موثوقًا به. وفي مناطق أخرى، قد يكون مربع R بقيمة 0.3 فقط كافيًا إذا كان هناك تباين شديد في مجموعة البيانات.

لمعرفة ما تعتبر قيمة R-squared “جيدة”، ستحتاج إلى استكشاف قيم R-squared المقبولة عمومًا في مجال دراستك المحدد. إذا كنت تقوم بإجراء تحليل الانحدار لعميل أو شركة، فقد تتمكن من سؤالهم عن قيمة R-squared المقبولة.

فترات التنبؤ

تحدد فترة التنبؤ النطاق الذي يمكن أن تقع ضمنه ملاحظة جديدة، بناءً على قيم متغيرات التوقع. تشير فترات التنبؤ الأضيق إلى أن متغيرات التوقع يمكنها التنبؤ بمتغير الاستجابة بشكل أكثر دقة.

غالبًا ما تكون فترة التنبؤ أكثر فائدة من قيمة R-squared لأنها تمنحك نطاقًا محددًا من القيم التي قد تقع ضمنها ملاحظة جديدة. يعد هذا مفيدًا بشكل خاص إذا كان هدفك الأساسي من الانحدار هو التنبؤ بالقيم الجديدة لمتغير الاستجابة.

على سبيل المثال، افترض أن عدد السكان يبلغ 40000 نسمة وينتج فترة تنبؤية تتراوح بين 30 إلى 35 بائع زهور في مدينة معينة. قد يعتبر أو لا يعتبر هذا نطاقًا مقبولًا من القيم، اعتمادًا على استخدام نموذج الانحدار.

خاتمة

بشكل عام، كلما كانت قيمة R-squared أكبر، زادت دقة متغيرات التوقع في التنبؤ بقيمة متغير الاستجابة.

إن مدى جودة قيمة R-squared لكي تعتبر “جيدة” يختلف باختلاف المجال. تتطلب بعض المجالات دقة أعلى من غيرها.

لمعرفة ما يعتبر قيمة R-squared “جيدة”، فكر في ما هو مقبول بشكل عام في المجال الذي تعمل فيه، أو اسأل شخصًا لديه معرفة محددة في مجال معين، أو اسأل العميل/العميل. الشركة التي تقوم بإجراء تحليل الانحدار لها. لما يعتبرونه مقبولا.

إذا كنت تريد شرح العلاقة بين المتنبئ ومتغير الاستجابة، فإن R-squared غير ذي صلة إلى حد كبير لأنه ليس له أي تأثير على تفسير نموذج الانحدار.

إذا كنت تريد التنبؤ بمتغير الاستجابة، فإن فترات التنبؤ تكون أكثر فائدة بشكل عام من قيم R-squared.

قراءة متعمقة:

معامل ارتباط بيرسون
مقدمة إلى الانحدار الخطي البسيط

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *