Google शीट्स में रैखिक प्रतिगमन कैसे करें
रैखिक प्रतिगमन एक ऐसी विधि है जिसका उपयोग एक या अधिक व्याख्यात्मक चर और एक प्रतिक्रिया चर के बीच संबंध को मापने के लिए किया जा सकता है।
जब केवल एक व्याख्यात्मक चर होता है तो हम सरल रैखिक प्रतिगमन का उपयोग करते हैं और जब दो या अधिक व्याख्यात्मक चर होते हैं तो एकाधिक रैखिक प्रतिगमन का उपयोग करते हैं।
दोनों प्रकार के प्रतिगमन को Google शीट्स LINEST() फ़ंक्शन का उपयोग करके निष्पादित किया जा सकता है, जो निम्नलिखित सिंटैक्स का उपयोग करता है:
LINEST (ज्ञात_डेटा_वाई, ज्ञात_डेटा_x, कैलकुलेट_बी, वर्बोज़)
सोना:
- ज्ञात_डेटा_y: प्रतिक्रिया मानों की सरणी
- ज्ञात_डेटा_x: व्याख्यात्मक मानों की तालिका
- कैलकुलेट_बी: इंगित करता है कि इंटरसेप्ट की गणना करनी है या नहीं। यह डिफ़ॉल्ट रूप से सत्य है और हम इसे रैखिक प्रतिगमन के लिए ऐसे ही छोड़ देते हैं।
- वर्बोज़: इंगित करता है कि केवल ढलान और अवरोधन से परे अतिरिक्त प्रतिगमन आँकड़े प्रदान करना है या नहीं। यह डिफ़ॉल्ट रूप से गलत है, लेकिन हम अपने उदाहरणों में निर्दिष्ट करेंगे कि यह सत्य है।
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
Google शीट्स में सरल रैखिक प्रतिगमन
मान लीजिए हम अध्ययन किए गए घंटों और परीक्षा परिणामों के बीच संबंध को समझना चाहते हैं। किसी परीक्षा के लिए अध्ययन करना और परीक्षा में प्राप्त ग्रेड।
इस संबंध का पता लगाने के लिए, हम व्याख्यात्मक चर के रूप में अध्ययन किए गए घंटों और प्रतिक्रिया चर के रूप में परीक्षा स्कोर का उपयोग करके एक सरल रैखिक प्रतिगमन कर सकते हैं।
निम्नलिखित स्क्रीनशॉट दिखाता है कि सेल डी2 में प्रयुक्त निम्नलिखित सूत्र के साथ 20 छात्रों के डेटा सेट का उपयोग करके एक सरल रैखिक प्रतिगमन कैसे किया जाए:
= रेखा ( बी2:बी21 , ए2:ए21 , सत्य , सत्य )
निम्नलिखित स्क्रीनशॉट आउटपुट के लिए एनोटेशन प्रदान करता है:
परिणाम में सर्वाधिक प्रासंगिक संख्याओं की व्याख्या करने का तरीका यहां बताया गया है:
आर स्क्वायर: 0.72725 । इसे निर्धारण गुणांक कहा जाता है। यह प्रतिक्रिया चर में भिन्नता का अनुपात है जिसे व्याख्यात्मक चर द्वारा समझाया जा सकता है। इस उदाहरण में, परीक्षा के अंकों में लगभग 72.73% भिन्नता को अध्ययन किए गए घंटों की संख्या से समझाया जा सकता है।
मानक त्रुटि: 5.2805 । यह प्रेक्षित मानों और प्रतिगमन रेखा के बीच की औसत दूरी है। इस उदाहरण में, देखे गए मान प्रतिगमन रेखा से औसतन 5.2805 इकाइयों तक विचलित होते हैं।
गुणांक: गुणांक हमें अनुमानित प्रतिगमन समीकरण लिखने के लिए आवश्यक संख्याएँ देते हैं। इस उदाहरण में, अनुमानित प्रतिगमन समीकरण है:
परीक्षा स्कोर = 67.16 + 5.2503*(घंटे)
हम घंटों के गुणांक की व्याख्या इस तरह करते हैं कि अध्ययन किए गए प्रत्येक अतिरिक्त घंटे के लिए, परीक्षा स्कोर में औसतन 5.2503 की वृद्धि होनी चाहिए। हम अवरोधन के गुणांक की व्याख्या इस अर्थ में करते हैं कि शून्य घंटे का अध्ययन करने वाले छात्र के लिए अपेक्षित परीक्षा स्कोर 67.16 है।
हम अध्ययन के घंटों की संख्या के आधार पर, किसी छात्र के लिए अपेक्षित परीक्षा स्कोर की गणना करने के लिए इस अनुमानित प्रतिगमन समीकरण का उपयोग कर सकते हैं। उदाहरण के लिए, एक छात्र जो तीन घंटे पढ़ाई करता है, उसे 82.91 का परीक्षा स्कोर प्राप्त करना चाहिए:
परीक्षा स्कोर = 67.16 + 5.2503*(3) = 82.91
Google शीट्स में मल्टीपल लीनियर रिग्रेशन
मान लीजिए कि हम यह जानना चाहते हैं कि क्या अध्ययन में बिताए गए घंटों की संख्या और ली गई तैयारी परीक्षाओं की संख्या किसी छात्र को किसी निश्चित कॉलेज प्रवेश परीक्षा में मिलने वाले ग्रेड को प्रभावित करती है।
इस संबंध का पता लगाने के लिए, हम अध्ययन किए गए घंटों और व्याख्यात्मक चर के रूप में ली गई प्रारंभिक परीक्षाओं और प्रतिक्रिया चर के रूप में परीक्षा परिणामों का उपयोग करके एक बहु रेखीय प्रतिगमन कर सकते हैं।
निम्नलिखित स्क्रीनशॉट दिखाता है कि सेल E2 में उपयोग किए गए निम्न सूत्र के साथ 20 छात्रों के डेटा सेट का उपयोग करके एकाधिक रैखिक प्रतिगमन कैसे करें:
= सही ( C2:C21 , A2:B21 , TRUE , TRUE )
परिणाम में सर्वाधिक प्रासंगिक संख्याओं की व्याख्या करने का तरीका यहां बताया गया है:
आर स्क्वायर: 0.734 । इसे निर्धारण गुणांक कहा जाता है। यह प्रतिक्रिया चर के विचरण का अनुपात है जिसे व्याख्यात्मक चर द्वारा समझाया जा सकता है। इस उदाहरण में, परीक्षा के अंकों में 73.4% भिन्नता को अध्ययन किए गए घंटों की संख्या और ली गई तैयारी परीक्षाओं की संख्या द्वारा समझाया गया है।
मानक त्रुटि: 5.3657 । यह प्रेक्षित मानों और प्रतिगमन रेखा के बीच की औसत दूरी है। इस उदाहरण में, देखे गए मान प्रतिगमन रेखा से औसतन 5.3657 इकाइयों तक विचलित होते हैं।
अनुमानित प्रतिगमन समीकरण: हम निम्नलिखित अनुमानित प्रतिगमन समीकरण बनाने के लिए मॉडल आउटपुट से गुणांक का उपयोग कर सकते हैं:
परीक्षा स्कोर = 67.67 + 5.56*(घंटे) – 0.60*(प्रारंभिक परीक्षा)
हम अध्ययन के घंटों की संख्या और उनके द्वारा दी जाने वाली अभ्यास परीक्षाओं की संख्या के आधार पर, किसी छात्र के लिए अपेक्षित परीक्षा स्कोर की गणना करने के लिए इस अनुमानित प्रतिगमन समीकरण का उपयोग कर सकते हैं। उदाहरण के लिए, एक छात्र जो तीन घंटे पढ़ाई करता है और तैयारी परीक्षा देता है, उसे 83.75 का ग्रेड मिलना चाहिए:
परीक्षा स्कोर = 67.67 + 5.56*(3) – 0.60*(1) = 83.75
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि Google शीट्स में अन्य सामान्य कार्य कैसे करें:
Google शीट्स में बहुपद प्रतिगमन कैसे करें
Google शीट्स में एक अवशिष्ट प्लॉट कैसे बनाएं