फिट की गुणवत्ता
यह आलेख बताता है कि आँकड़ों में फिट की अच्छाई क्या है। इसी तरह, यह दिखाता है कि प्रतिगमन मॉडल की फिट की अच्छाई को कैसे मापा जाए और इसके अलावा, आप फिट की अच्छाई का एक हल किया हुआ अभ्यास देख पाएंगे।
फिट की अच्छाई क्या है?
आंकड़ों में, फिट की अच्छाई यह है कि एक प्रतिगमन मॉडल डेटा नमूने में कितनी अच्छी तरह फिट बैठता है। दूसरे शब्दों में, एक प्रतिगमन मॉडल की फिट की अच्छाई अवलोकनों के सेट और प्रतिगमन के माध्यम से प्राप्त मूल्यों के बीच युग्मन के स्तर को संदर्भित करती है।
इसलिए, प्रतिगमन मॉडल की फिट की अच्छाई जितनी बेहतर होगी, यह अध्ययन किए जा रहे डेटा को उतना ही बेहतर समझाएगा। इस प्रकार, हम चाहते हैं कि सांख्यिकीय मॉडल जितना बेहतर फिट होगा, उतना ही बेहतर होगा।

जैसा कि आप ऊपर की छवि से देख सकते हैं, किसी अवलोकन का मूल्य आमतौर पर प्रतिगमन मॉडल द्वारा पूरी तरह से समझाया नहीं जा सकता है। लेकिन तार्किक रूप से, जितना अधिक प्रतिगमन मॉडल डेटासेट से समझा सकता है, उतना बेहतर मॉडल फिट होगा। संक्षेप में, हम एक ऐसे प्रतिगमन मॉडल में रुचि रखते हैं जो यथासंभव सख्त हो।
प्रतिगमन मॉडल के फिट होने की अच्छाई
प्रतिगमन मॉडल के फिट की अच्छाई को निर्धारित करने के लिए, आमतौर पर निर्धारण के गुणांक का उपयोग किया जाता है , जो एक सांख्यिकीय गुणांक है जो प्रतिगमन मॉडल द्वारा समझाए गए प्रतिशत को इंगित करता है। इस प्रकार, किसी मॉडल के निर्धारण का गुणांक जितना अधिक होगा, मॉडल उतना ही बेहतर डेटा नमूने के अनुकूल होगा।
![]()
हालाँकि, यह ध्यान दिया जाना चाहिए कि प्रतिगमन मॉडल में जितने अधिक चर होंगे, उसके निर्धारण का गुणांक उतना ही अधिक होगा। इस कारण से, निर्धारण के समायोजित गुणांक का उपयोग अक्सर किसी मॉडल की फिट की अच्छाई को मापने के लिए भी किया जाता है। निर्धारण का समायोजित गुणांक पिछले गुणांक का एक रूपांतर है जो प्रतिगमन मॉडल द्वारा समझाए गए प्रतिशत को इंगित करता है, जो मॉडल में शामिल प्रत्येक व्याख्यात्मक चर के लिए दंडात्मक है।
![]()
इसलिए कई अलग-अलग चर वाले दो मॉडलों की तुलना करने के लिए निर्धारण के समायोजित गुणांक का उपयोग करना बेहतर है, क्योंकि यह मॉडल में शामिल चर की संख्या को ध्यान में रखता है।
अंत में, यह ध्यान दिया जाना चाहिए कि ची-स्क्वायर परीक्षण का उपयोग प्रतिगमन मॉडल के फिट की अच्छाई को मापने के लिए भी किया जा सकता है, हालांकि पिछले दो गुणांक के मान आमतौर पर उपयोग किए जाते हैं।
अच्छी फिट का ठोस उदाहरण
अंत में, हम इस सांख्यिकीय अवधारणा को आत्मसात करने के लिए समायोजन की गुणवत्ता में एक हल किया गया अभ्यास देखेंगे।
- समान डेटा श्रृंखला के साथ, दो अलग-अलग रैखिक प्रतिगमन मॉडल निष्पादित किए जाते हैं, जिनके परिणाम आप निम्न तालिका में देख सकते हैं। किस मॉडल का उपयोग करना सर्वोत्तम है?
| प्रतिगमन मॉडल 1 | प्रतिगमन मॉडल 2 | |
|---|---|---|
| निर्धारण का गुणांक | 57% | 64% |
| समायोजित निर्धारण गुणांक | 49% | 43% |
| व्याख्यात्मक चरों की संख्या | 3 | 7 |
इस मामले में, हम मानते हैं कि दोनों मॉडल रैखिक प्रतिगमन मॉडल की पिछली धारणाओं को संतुष्ट करते हैं और इसलिए, हमें केवल मॉडलों की फिट की अच्छाई का विश्लेषण करने की आवश्यकता है।
प्रतिगमन मॉडल 2 में प्रतिगमन मॉडल 1 की तुलना में निर्धारण का गुणांक अधिक है, इसलिए यह एक बेहतर प्रतिगमन मॉडल होने की प्राथमिकता लगती है क्योंकि यह डेटा नमूने को बेहतर ढंग से समझाने में सक्षम है।
हालाँकि, रिग्रेशन मॉडल 2 में 7 स्वतंत्र चर हैं, जबकि रिग्रेशन मॉडल 1 में केवल 3 हैं। इसलिए मॉडल 2 पहले मॉडल की तुलना में अधिक जटिल और व्याख्या करने में कठिन होगा।
इसके अतिरिक्त, यदि हम निर्धारण के समायोजित गुणांक को देखते हैं, जो मॉडल में चर की संख्या को ध्यान में रखता है, तो प्रतिगमन मॉडल 1 में प्रतिगमन मॉडल 2 की तुलना में निर्धारण का अधिक समायोजित गुणांक होता है।
निष्कर्ष में, हालांकि प्रतिगमन मॉडल 1 का उपयोग करना बेहतर है, क्योंकि इसके निर्धारण का समायोजित गुणांक प्रतिगमन मॉडल 2 की तुलना में अधिक है। प्रतिगमन मॉडल 2 में निर्धारण का एक उच्च असमायोजित गुणांक है, ऐसा इसलिए है क्योंकि उन्होंने प्रतिगमन में कई और चर शामिल किए हैं मॉडल 1. मॉडल, जो उक्त गुणांक के मूल्य को बढ़ाता है लेकिन मॉडल की व्याख्या को और अधिक कठिन बना देता है और, निश्चित रूप से, एक नए मूल्य की भविष्यवाणी को बदतर बना देता है।
विभिन्न संख्या में चर वाले मॉडल की तुलना करने के लिए, निर्धारण के समायोजित गुणांक का उपयोग करना सबसे अच्छा है क्योंकि यह मॉडल में जोड़े गए प्रत्येक चर के लिए दंडित करता है। जैसा कि आपने इस उदाहरण में देखा, निर्धारण के असमायोजित गुणांक के अनुसार, प्रतिगमन मॉडल 2 बेहतर है, हालांकि, निर्धारण के समायोजित गुणांक के माध्यम से हम जान सकते हैं कि प्रतिगमन मॉडल 1 वास्तव में बेहतर है।