फिट की गुणवत्ता

यह आलेख बताता है कि आँकड़ों में फिट की अच्छाई क्या है। इसी तरह, यह दिखाता है कि प्रतिगमन मॉडल की फिट की अच्छाई को कैसे मापा जाए और इसके अलावा, आप फिट की अच्छाई का एक हल किया हुआ अभ्यास देख पाएंगे।

फिट की अच्छाई क्या है?

आंकड़ों में, फिट की अच्छाई यह है कि एक प्रतिगमन मॉडल डेटा नमूने में कितनी अच्छी तरह फिट बैठता है। दूसरे शब्दों में, एक प्रतिगमन मॉडल की फिट की अच्छाई अवलोकनों के सेट और प्रतिगमन के माध्यम से प्राप्त मूल्यों के बीच युग्मन के स्तर को संदर्भित करती है।

इसलिए, प्रतिगमन मॉडल की फिट की अच्छाई जितनी बेहतर होगी, यह अध्ययन किए जा रहे डेटा को उतना ही बेहतर समझाएगा। इस प्रकार, हम चाहते हैं कि सांख्यिकीय मॉडल जितना बेहतर फिट होगा, उतना ही बेहतर होगा।

फिट की गुणवत्ता

जैसा कि आप ऊपर की छवि से देख सकते हैं, किसी अवलोकन का मूल्य आमतौर पर प्रतिगमन मॉडल द्वारा पूरी तरह से समझाया नहीं जा सकता है। लेकिन तार्किक रूप से, जितना अधिक प्रतिगमन मॉडल डेटासेट से समझा सकता है, उतना बेहतर मॉडल फिट होगा। संक्षेप में, हम एक ऐसे प्रतिगमन मॉडल में रुचि रखते हैं जो यथासंभव सख्त हो।

प्रतिगमन मॉडल के फिट होने की अच्छाई

प्रतिगमन मॉडल के फिट की अच्छाई को निर्धारित करने के लिए, आमतौर पर निर्धारण के गुणांक का उपयोग किया जाता है , जो एक सांख्यिकीय गुणांक है जो प्रतिगमन मॉडल द्वारा समझाए गए प्रतिशत को इंगित करता है। इस प्रकार, किसी मॉडल के निर्धारण का गुणांक जितना अधिक होगा, मॉडल उतना ही बेहतर डेटा नमूने के अनुकूल होगा।

R^2= \text{Coeficiente de determinaci\'on}

हालाँकि, यह ध्यान दिया जाना चाहिए कि प्रतिगमन मॉडल में जितने अधिक चर होंगे, उसके निर्धारण का गुणांक उतना ही अधिक होगा। इस कारण से, निर्धारण के समायोजित गुणांक का उपयोग अक्सर किसी मॉडल की फिट की अच्छाई को मापने के लिए भी किया जाता है। निर्धारण का समायोजित गुणांक पिछले गुणांक का एक रूपांतर है जो प्रतिगमन मॉडल द्वारा समझाए गए प्रतिशत को इंगित करता है, जो मॉडल में शामिल प्रत्येक व्याख्यात्मक चर के लिए दंडात्मक है।

\bar{R}^2= \text{Coeficiente de determinaci\'on ajustado}

इसलिए कई अलग-अलग चर वाले दो मॉडलों की तुलना करने के लिए निर्धारण के समायोजित गुणांक का उपयोग करना बेहतर है, क्योंकि यह मॉडल में शामिल चर की संख्या को ध्यान में रखता है।

अंत में, यह ध्यान दिया जाना चाहिए कि ची-स्क्वायर परीक्षण का उपयोग प्रतिगमन मॉडल के फिट की अच्छाई को मापने के लिए भी किया जा सकता है, हालांकि पिछले दो गुणांक के मान आमतौर पर उपयोग किए जाते हैं।

अच्छी फिट का ठोस उदाहरण

अंत में, हम इस सांख्यिकीय अवधारणा को आत्मसात करने के लिए समायोजन की गुणवत्ता में एक हल किया गया अभ्यास देखेंगे।

  • समान डेटा श्रृंखला के साथ, दो अलग-अलग रैखिक प्रतिगमन मॉडल निष्पादित किए जाते हैं, जिनके परिणाम आप निम्न तालिका में देख सकते हैं। किस मॉडल का उपयोग करना सर्वोत्तम है?
प्रतिगमन मॉडल 1 प्रतिगमन मॉडल 2
निर्धारण का गुणांक 57% 64%
समायोजित निर्धारण गुणांक 49% 43%
व्याख्यात्मक चरों की संख्या 3 7

इस मामले में, हम मानते हैं कि दोनों मॉडल रैखिक प्रतिगमन मॉडल की पिछली धारणाओं को संतुष्ट करते हैं और इसलिए, हमें केवल मॉडलों की फिट की अच्छाई का विश्लेषण करने की आवश्यकता है।

प्रतिगमन मॉडल 2 में प्रतिगमन मॉडल 1 की तुलना में निर्धारण का गुणांक अधिक है, इसलिए यह एक बेहतर प्रतिगमन मॉडल होने की प्राथमिकता लगती है क्योंकि यह डेटा नमूने को बेहतर ढंग से समझाने में सक्षम है।

हालाँकि, रिग्रेशन मॉडल 2 में 7 स्वतंत्र चर हैं, जबकि रिग्रेशन मॉडल 1 में केवल 3 हैं। इसलिए मॉडल 2 पहले मॉडल की तुलना में अधिक जटिल और व्याख्या करने में कठिन होगा।

इसके अतिरिक्त, यदि हम निर्धारण के समायोजित गुणांक को देखते हैं, जो मॉडल में चर की संख्या को ध्यान में रखता है, तो प्रतिगमन मॉडल 1 में प्रतिगमन मॉडल 2 की तुलना में निर्धारण का अधिक समायोजित गुणांक होता है।

निष्कर्ष में, हालांकि प्रतिगमन मॉडल 1 का उपयोग करना बेहतर है, क्योंकि इसके निर्धारण का समायोजित गुणांक प्रतिगमन मॉडल 2 की तुलना में अधिक है। प्रतिगमन मॉडल 2 में निर्धारण का एक उच्च असमायोजित गुणांक है, ऐसा इसलिए है क्योंकि उन्होंने प्रतिगमन में कई और चर शामिल किए हैं मॉडल 1. मॉडल, जो उक्त गुणांक के मूल्य को बढ़ाता है लेकिन मॉडल की व्याख्या को और अधिक कठिन बना देता है और, निश्चित रूप से, एक नए मूल्य की भविष्यवाणी को बदतर बना देता है।

विभिन्न संख्या में चर वाले मॉडल की तुलना करने के लिए, निर्धारण के समायोजित गुणांक का उपयोग करना सबसे अच्छा है क्योंकि यह मॉडल में जोड़े गए प्रत्येक चर के लिए दंडित करता है। जैसा कि आपने इस उदाहरण में देखा, निर्धारण के असमायोजित गुणांक के अनुसार, प्रतिगमन मॉडल 2 बेहतर है, हालांकि, निर्धारण के समायोजित गुणांक के माध्यम से हम जान सकते हैं कि प्रतिगमन मॉडल 1 वास्तव में बेहतर है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *