निर्धारण का गुणांक (आर वर्ग)

यह आलेख बताता है कि आंकड़ों में निर्धारण का गुणांक (या आर वर्ग) क्या है। तो, आप जानेंगे कि निर्धारण के गुणांक की गणना कैसे करें, इसकी व्याख्या कैसे की जाती है और, इसके अलावा, डेटा नमूने के निर्धारण के गुणांक की गणना करने के लिए एक ऑनलाइन कैलकुलेटर भी।

निर्धारण का गुणांक (आर वर्ग) क्या है?

निर्धारण का गुणांक , जिसका प्रतीक आर 2 ( आर वर्ग ) है, एक आँकड़ा है जो एक प्रतिगमन मॉडल के फिट की अच्छाई को मापता है। निर्धारण का गुणांक दर्शाता है कि एक प्रतिगमन मॉडल डेटा सेट में कितनी अच्छी तरह फिट बैठता है, अर्थात, यह प्रतिगमन मॉडल द्वारा समझाए गए प्रतिशत को इंगित करता है।

इसलिए, निर्धारण का गुणांक जितना अधिक होगा, प्रतिगमन मॉडल उतना ही बेहतर होगा। हालाँकि यह शर्त हमेशा पूरी नहीं होती है, हम सैद्धांतिक रूप से यथासंभव बड़े निर्धारण गुणांक में रुचि रखते हैं। हम नीचे देखेंगे कि निर्धारण के गुणांक की व्याख्या कैसे करें।

गुणांक निर्धारण का सूत्र

निर्धारण का गुणांक अवशिष्ट विचरण और आश्रित चर के विचरण के बीच के अनुपात को घटाकर एक के बराबर है। निर्धारण के गुणांक की गणना वर्गों के कुल योग में से वर्गों के योग को एक घटा कर भी की जा सकती है।

इस प्रकार, निर्धारण के गुणांक की गणना करने का सूत्र इस प्रकार है:

निर्धारण के गुणांक के लिए सूत्र, आर वर्ग के लिए सूत्र

सोना:

  • R^2

    निर्धारण का गुणांक है.

  • \sigma_r^2

    अवशिष्ट विचरण है.

  • \sigma^2

    आश्रित चर Y का प्रसरण है।

  • y_{i}

    अवलोकन पर निर्भर चर i का मान है।

  • \widehat{y}_{i}

    अवलोकन i के लिए प्रतिगमन मॉडल द्वारा अनुमानित मूल्य है।

  • \overline{y}

    सभी अवलोकनों पर निर्भर चर का माध्य है।

👉 आप किसी भी डेटा सेट के निर्धारण के गुणांक की गणना करने के लिए नीचे दिए गए कैलकुलेटर का उपयोग कर सकते हैं।

रैखिक प्रतिगमन मॉडल के मामले में, निर्धारण का गुणांक सहसंबंध गुणांक के वर्ग के बराबर है:

R^2=\cfrac{\sigma_{XY}^2}{\sigma_X^2\sigma_Y^2}=\rho^2

सोना

\sigma_{XY}^2

चर X और Y का सहप्रसरण है,

\sigma_X^2

और

\sigma_Y^2

क्रमशः स्वतंत्र चर X और आश्रित चर Y के प्रसरण हैं।

निर्धारण कैलकुलेटर का गुणांक

एक सरल रैखिक प्रतिगमन मॉडल को फिट करने और इसके निर्धारण के गुणांक की गणना करने के लिए नीचे दिए गए कैलकुलेटर में एक नमूना डेटा प्लग करें। आपको डेटा जोड़े को अलग करने की आवश्यकता है, ताकि पहले बॉक्स में केवल स्वतंत्र चर X के मान हों और दूसरे बॉक्स में केवल आश्रित चर Y के मान हों।

डेटा को एक स्थान से अलग किया जाना चाहिए और दशमलव विभाजक के रूप में अवधि का उपयोग करके दर्ज किया जाना चाहिए।

  • स्वतंत्र चर

  • आश्रित चर Y:

निर्धारण के गुणांक की व्याख्या

इस अनुभाग में हम देखेंगे कि निर्धारण के गुणांक की व्याख्या कैसे करें, क्योंकि निर्धारण के गुणांक का मूल्य जानने का कोई मतलब नहीं है यदि आप बाद में नहीं जानते कि इसका क्या अर्थ है।

निर्धारण के गुणांक का मान 0 से 1 तक हो सकता है, हालाँकि, इसे आमतौर पर प्रतिशत के रूप में व्यक्त किया जाता है, इसलिए न्यूनतम 0% और अधिकतम 100% है।

निर्धारण के गुणांक की व्याख्या के संबंध में, इसका मूल्य जितना अधिक होगा इसका मतलब है कि प्रतिगमन मॉडल डेटा नमूने को बेहतर ढंग से समझाता है। इस प्रकार, निर्धारण का गुणांक 1 के जितना करीब होगा, मॉडल उतना ही अधिक समायोजित किया जाएगा। दूसरी ओर, यह 0 के जितना करीब होगा, उत्पादित प्रतिगमन मॉडल उतना ही कम विश्वसनीय होगा।

हालाँकि, दो प्रतिगमन मॉडल की तुलना करते समय, उच्च प्रतिगमन गुणांक वाला मॉडल हमेशा बेहतर नहीं होता है। उदाहरण के लिए, एक प्रतिगमन मॉडल में प्रतिगमन गुणांक आर 2 = 100% हो सकता है क्योंकि मॉडल में कई व्याख्यात्मक चर जोड़े गए हैं और इसलिए, यह सभी अवलोकनों को पूरी तरह से समझा सकता है। लेकिन यह मॉडल निश्चित रूप से एक नए मूल्य के लिए बहुत खराब भविष्यवाणी करता है जिसका उपयोग प्रतिगमन मॉडल के निर्माण के लिए नहीं किया गया था।

यह भी ध्यान में रखा जाना चाहिए कि परिणामी प्रतिगमन मॉडल पिछली धारणाओं को पूरा करता है। इस प्रकार, निर्धारण के बहुत उच्च गुणांक वाला एक मॉडल बेकार है यदि इसके अवशेषों की परिवर्तनशीलता स्थिर नहीं है (समरूपता)।

इसके अलावा, निर्धारण का गुणांक एक महत्वपूर्ण सीमा प्रस्तुत करता है, क्योंकि यह व्याख्यात्मक चर के समावेशन को दंडित नहीं करता है। तार्किक रूप से, एक प्रतिगमन मॉडल में जितने अधिक व्याख्यात्मक चर होंगे, मॉडल उतना ही अधिक जटिल होगा, लेकिन यह देखे गए डेटा को उतना ही बेहतर समझाएगा और इसलिए, निर्धारण का गुणांक उतना ही अधिक होगा। हालाँकि, निर्धारण का समायोजित गुणांक मॉडल में चर की संख्या को ध्यान में रखता है (हम देखेंगे कि इसकी गणना कैसे की जाती है)।

निष्कर्ष में, प्रतिगमन मॉडल का विश्लेषण करने के लिए निर्धारण का गुणांक बहुत उपयोगी है क्योंकि यह हमें बताता है कि प्रतिगमन मॉडल डेटा सेट में कितनी अच्छी तरह फिट बैठता है। हालाँकि, परिणामी मॉडल की समीक्षा के लिए अन्य उपकरणों का भी उपयोग किया जाना चाहिए, जैसे सांख्यिकीय ग्राफ़

समायोजित निर्धारण गुणांक

निर्धारण का समायोजित गुणांक , जिसे निर्धारण का समायोजित गुणांक भी कहा जाता है, मॉडल में शामिल व्याख्यात्मक चर की संख्या को ध्यान में रखकर एक प्रतिगमन मॉडल के फिट की अच्छाई को मापता है।

निर्धारण के गुणांक और निर्धारण के समायोजित गुणांक के बीच अंतर यह है कि निर्धारण का गुणांक चर की संख्या को ध्यान में रखे बिना समायोजन की गुणवत्ता को मापता है, दूसरी ओर, निर्धारण का समायोजित गुणांक समायोजन की गुणवत्ता को मापता है प्रत्येक जोड़े गए चर के लिए दंड देना।

निर्धारण के समायोजित गुणांक की गणना करने का सूत्र इस प्रकार है:

\bar{R}^2=1-\cfrac{N-1}{N-k-1}\cdot (1-R^2)

सोना:

  • \bar{R}^2

    निर्धारण का समायोजित गुणांक है।

  • R^2

    निर्धारण का गुणांक है.

  • N

    नमूना आकार है.

  • k

    प्रतिगमन मॉडल में व्याख्यात्मक चर की संख्या है।

इसलिए, दो अलग-अलग मॉडलों की तुलना करने के लिए निर्धारण का समायोजित गुणांक निर्धारण के गुणांक से बेहतर है, क्योंकि मॉडल में व्याख्यात्मक चर की एक अलग संख्या हो सकती है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *