एक मितव्ययी मॉडल क्या है?
एक कंजूस मॉडल वह है जो यथासंभव कम व्याख्यात्मक चर का उपयोग करके वांछित स्तर को प्राप्त करता है।
इस प्रकार के मॉडल के पीछे का तर्क ओकाम के रेजर (कभी-कभी “पारसीमोनी सिद्धांत” कहा जाता है) के विचार से उत्पन्न होता है जो कहता है कि सबसे सरल स्पष्टीकरण संभवतः सही है।
आँकड़ों पर लागू करें, एक मॉडल जिसमें कुछ पैरामीटर हैं लेकिन फिट का एक संतोषजनक स्तर प्राप्त होता है उसे उस मॉडल की तुलना में प्राथमिकता दी जानी चाहिए जिसमें बहुत सारे पैरामीटर हैं और केवल थोड़ा उच्च स्तर का फिट प्राप्त होता है।
इसके दो कारण हैं:
1. पारसीमोनियस मॉडल की व्याख्या करना और समझना आसान होता है। कम पैरामीटर वाले मॉडल को समझना और समझाना आसान होता है।
2. कंजूस मॉडल में अधिक पूर्वानुमान लगाने की क्षमता होती है। नए डेटा पर लागू होने पर कम पैरामीटर वाले मॉडल बेहतर प्रदर्शन करते हैं।
इन विचारों को स्पष्ट करने के लिए निम्नलिखित दो उदाहरणों पर विचार करें।
उदाहरण 1: कंजूस मॉडल = आसान व्याख्या
मान लीजिए कि हम रियल एस्टेट की कीमतों की भविष्यवाणी करने के लिए रियल एस्टेट से संबंधित व्याख्यात्मक चर के एक सेट का उपयोग करके एक मॉडल बनाना चाहते हैं। निम्नलिखित दो मॉडलों पर उनके समायोजित आर-वर्ग के साथ विचार करें:
मॉडल 1:
- समीकरण: घर की कीमत = 8,830 + 81*(वर्ग फुट)
- समायोजित R2 : 0.7734
मॉडल 2:
- समीकरण: घर की कीमत = 8,921 + 77*(वर्ग फुट) + 7*(वर्ग फुट) 2 – 9*(आयु) + 600*(बेडरूम) + 38*(स्नानघर)
- समायोजित R2 : 0.7823
पहले मॉडल में केवल एक व्याख्यात्मक चर और 0.7734 का समायोजित R2 है , जबकि दूसरे मॉडल में थोड़ा अधिक समायोजित R2 के साथ पांच व्याख्यात्मक चर हैं।
कंजूसी के सिद्धांत के आधार पर, हम पहले मॉडल का उपयोग करना पसंद करेंगे क्योंकि प्रत्येक मॉडल में घर की कीमतों में भिन्नता को समझाने की लगभग समान क्षमता होती है लेकिन पहले मॉडल को समझना और समझाना बहुत आसान है।
उदाहरण के लिए, पहले मॉडल में, हम जानते हैं कि एक घर के वर्ग फ़ुटेज में एक-इकाई की वृद्धि औसत घर की कीमत $81 की वृद्धि से जुड़ी है। इसे समझना और समझाना सरल है।
हालाँकि, दूसरे उदाहरण में, गुणांक अनुमान की व्याख्या करना अधिक कठिन है। उदाहरण के लिए, घर में एक अतिरिक्त कमरा घर की कीमत में $600 की औसत वृद्धि के साथ जुड़ा हुआ है, यह मानते हुए कि वर्ग फुटेज, घर की उम्र और बाथरूम की संख्या स्थिर रहती है। इसे समझना और समझाना कहीं अधिक कठिन है।
उदाहरण 2: मितव्ययी मॉडल = बेहतर भविष्यवाणियाँ
कंजूस मॉडल भी नए डेटा सेट पर अधिक सटीक भविष्यवाणियां करते हैं क्योंकि उनके मूल डेटा सेट से अधिक फिट होने की संभावना कम होती है।
सामान्य तौर पर, अधिक पैरामीटर वाले मॉडल कम पैरामीटर वाले मॉडल की तुलना में अधिक सख्त फिट और उच्च आर 2 मान उत्पन्न करेंगे। दुर्भाग्य से, किसी मॉडल में बहुत सारे पैरामीटर शामिल करने से मॉडल व्याख्यात्मक चर के बीच वास्तविक अंतर्निहित संबंध के बजाय डेटा के शोर (या “यादृच्छिकता”) को समायोजित कर सकता है। और प्रतिक्रिया चर।
इसका मतलब यह है कि कई मापदंडों वाला एक बहुत ही जटिल मॉडल नए डेटासेट पर खराब प्रदर्शन कर सकता है, जिसे उसने पहले कभी नहीं देखा है, कम मापदंडों वाले एक सरल मॉडल की तुलना में।
एक कंजूस मॉडल कैसे चुनें
मॉडल चयन के विषय पर एक संपूर्ण पाठ्यक्रम समर्पित हो सकता है, लेकिन अनिवार्य रूप से, एक कंजूस मॉडल चुनने का मतलब एक ऐसा मॉडल चुनना है जो एक मीट्रिक के अनुसार सबसे अच्छा प्रदर्शन करता है।
आमतौर पर उपयोग किए जाने वाले मेट्रिक्स जो प्रशिक्षण डेटासेट पर उनके प्रदर्शन और उनके मापदंडों की संख्या के आधार पर मॉडल का मूल्यांकन करते हैं, उनमें शामिल हैं:
1. अकाइक सूचना मानदंड (एआईसी)
किसी मॉडल के AIC की गणना निम्नानुसार की जा सकती है:
एआईसी = -2/एन * एलएल + 2 * के/एन
सोना:
- n: प्रशिक्षण डेटासेट में टिप्पणियों की संख्या।
- एलएल: प्रशिक्षण डेटासेट पर मॉडल की लॉग-संभावना।
- k: मॉडल में मापदंडों की संख्या।
इस पद्धति का उपयोग करके, आप प्रत्येक मॉडल के एआईसी की गणना कर सकते हैं और फिर सबसे कम एआईसी मान वाले मॉडल को सर्वोत्तम मॉडल के रूप में चुन सकते हैं।
यह दृष्टिकोण अगली विधि, बीआईसी की तुलना में अधिक जटिल मॉडल का पक्ष लेता है।
2. बायेसियन सूचना मानदंड (बीआईसी)
किसी मॉडल के BIC की गणना निम्नानुसार की जा सकती है:
बीआईसी = -2 * एलएल + लॉग (एन) * के
सोना:
- n: प्रशिक्षण डेटासेट में टिप्पणियों की संख्या।
- लॉग: प्राकृतिक लघुगणक (आधार ई)
- एलएल: प्रशिक्षण डेटासेट पर मॉडल की लॉग-संभावना।
- k: मॉडल में मापदंडों की संख्या।
इस पद्धति का उपयोग करके, आप प्रत्येक मॉडल के बीआईसी की गणना कर सकते हैं और फिर सबसे कम बीआईसी मान वाले मॉडल को सर्वोत्तम मॉडल के रूप में चुन सकते हैं।
यह दृष्टिकोण एआईसी पद्धति की तुलना में कम मापदंडों वाले मॉडल का पक्ष लेता है।
3. न्यूनतम विवरण लंबाई (एमडीएल)
एमडीएल सूचना सिद्धांत के क्षेत्र से मॉडलों का मूल्यांकन करने का एक तरीका है। इसकी गणना इस प्रकार की जा सकती है:
एमडीएल = एल(एच) + एल(डी | एच)
सोना:
- एच: मॉडल.
- डी: मॉडल द्वारा की गई भविष्यवाणियाँ।
- एल(एच): मॉडल का प्रतिनिधित्व करने के लिए आवश्यक बिट्स की संख्या।
- एल(डी | एच): प्रशिक्षण डेटा पर मॉडल की भविष्यवाणियों का प्रतिनिधित्व करने के लिए आवश्यक बिट्स की संख्या।
इस पद्धति का उपयोग करके, आप प्रत्येक मॉडल के एमडीएल की गणना कर सकते हैं और फिर सबसे कम एमडीएल मान वाले मॉडल को सर्वोत्तम मॉडल के रूप में चुन सकते हैं।
आप जिस प्रकार की समस्या पर काम कर रहे हैं, उसके आधार पर, इन तरीकों में से एक – एआईसी, बीआईसी, या एमडीएल – को एक उदार मॉडल का चयन करने के लिए दूसरों की तुलना में प्राथमिकता दी जा सकती है।