आर में प्रतिगमन गुणांक के लिए विश्वास अंतराल की गणना कैसे करें
एक रेखीय प्रतिगमन मॉडल में, एक प्रतिगमन गुणांक हमें भविष्यवक्ता चर में एक-इकाई वृद्धि के साथ जुड़े प्रतिक्रिया चर में औसत परिवर्तन बताता है।
प्रतिगमन गुणांक के लिए विश्वास अंतराल की गणना करने के लिए हम निम्नलिखित सूत्र का उपयोग कर सकते हैं:
β 1 के लिए आत्मविश्वास अंतराल: b 1 ± t 1-α/2, n-2 * se(b 1 )
सोना:
- बी 1 = प्रतिगमन गुणांक प्रतिगमन तालिका में दिखाया गया है
- t 1-∝/2, n-2 = स्वतंत्रता की n-2 डिग्री के साथ 1-∝ आत्मविश्वास स्तर के लिए महत्वपूर्ण t मान जहां n हमारे डेटासेट में अवलोकनों की कुल संख्या है
- से(बी 1 ) = बी 1 की मानक त्रुटि प्रतिगमन तालिका में दिखाई गई है
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में प्रतिगमन ढलान के लिए आत्मविश्वास अंतराल की गणना कैसे करें।
उदाहरण: आर में प्रतिगमन गुणांक के लिए आत्मविश्वास अंतराल
मान लीजिए कि हम एक विशेष कक्षा में 15 छात्रों के लिए भविष्यवक्ता चर के रूप में अध्ययन किए गए घंटों और प्रतिक्रिया चर के रूप में परीक्षा स्कोर का उपयोग करके एक सरल रैखिक प्रतिगमन मॉडल फिट करना चाहते हैं:
हम इस सरल रैखिक प्रतिगमन मॉडल को R में फिट करने के लिए lm() फ़ंक्शन का उपयोग कर सकते हैं:
#create data frame df <- data. frame (hours=c(1, 2, 4, 5, 5, 6, 6, 7, 8, 10, 11, 11, 12, 12, 14), score=c(64, 66, 76, 73, 74, 81, 83, 82, 80, 88, 84, 82, 91, 93, 89)) #fit linear regression model fit <- lm(score ~ hours, data=df) #view model summary summary(fit) Call: lm(formula = score ~ hours, data = df) Residuals: Min 1Q Median 3Q Max -5,140 -3,219 -1,193 2,816 5,772 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 65,334 2,106 31,023 1.41e-13 *** hours 1.982 0.248 7.995 2.25e-06 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.641 on 13 degrees of freedom Multiple R-squared: 0.831, Adjusted R-squared: 0.818 F-statistic: 63.91 on 1 and 13 DF, p-value: 2.253e-06
परिणाम में गुणांक अनुमानों का उपयोग करके, हम फिट किए गए सरल रैखिक प्रतिगमन मॉडल को निम्नानुसार लिख सकते हैं:
स्कोर = 65.334 + 1.982*(अध्ययन के घंटे)
ध्यान दें कि घंटों के लिए प्रतिगमन गुणांक 1.982 है।
यह हमें बताता है कि अध्ययन में बिताया गया प्रत्येक अतिरिक्त घंटा परीक्षा स्कोर में औसतन 1,982 की वृद्धि से जुड़ा है।
हम प्रतिगमन गुणांक के लिए 95% विश्वास अंतराल की गणना करने के लिए confint() फ़ंक्शन का उपयोग कर सकते हैं:
#calculate confidence interval for regression coefficient for 'hours' confint(fit, ' hours ', level= 0.95 ) 2.5% 97.5% hours 1.446682 2.518068
प्रतिगमन गुणांक के लिए 95% विश्वास अंतराल [1.446, 2.518] है।
चूँकि इस आत्मविश्वास अंतराल में मान 0 नहीं है, इसलिए हम यह निष्कर्ष निकाल सकते हैं कि अध्ययन किए गए घंटों और परीक्षा ग्रेड के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंध है।
हम प्रतिगमन गुणांक के लिए 95% विश्वास अंतराल की मैन्युअल रूप से गणना करके यह भी पुष्टि कर सकते हैं कि यह सही है:
- β 1 के लिए 95% CI: b 1 ± t 1-α/2, n-2 * se(b 1 )
- β 1 के लिए 95% सीआई: 1.982 ± टी 0.975, 15-2 * 0.248
- β 1 के लिए 95% सीआई: 1.982 ± 2.1604 * 0.248
- β 1 के लिए 95% सीआई: [1.446, 2.518]
प्रतिगमन गुणांक के लिए 95% विश्वास अंतराल [1.446, 2.518] है।
नोट #1 : हमने महत्वपूर्ण टी मान को खोजने के लिए व्युत्क्रम टी वितरण कैलकुलेटर का उपयोग किया जो 13 डिग्री स्वतंत्रता के साथ 95% आत्मविश्वास स्तर से मेल खाता है।
नोट #2 : एक अलग आत्मविश्वास स्तर के साथ आत्मविश्वास अंतराल की गणना करने के लिए, बस कॉन्फ़िंट() फ़ंक्शन में स्तर तर्क का मान बदलें।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल आर में रैखिक प्रतिगमन के बारे में अतिरिक्त जानकारी प्रदान करते हैं:
आर में प्रतिगमन आउटपुट की व्याख्या कैसे करें
आर में सरल रैखिक प्रतिगमन कैसे करें
आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
आर में लॉजिस्टिक रिग्रेशन कैसे करें