R में कॉन्फिट() फ़ंक्शन का उपयोग कैसे करें
फिटेड रिग्रेशन मॉडल में एक या अधिक मापदंडों के लिए कॉन्फिडेंस अंतराल की गणना करने के लिए आप आर में कॉन्फ़िंट() फ़ंक्शन का उपयोग कर सकते हैं।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
कॉन्फ़िंट (वस्तु, परम, स्तर = 0.95)
सोना:
- वस्तु : फिट किए गए प्रतिगमन मॉडल का नाम
- पर्म : पैरामीटर जिसके लिए आत्मविश्वास अंतराल की गणना की जाती है (डिफ़ॉल्ट सभी है)
- स्तर : उपयोग करने के लिए आत्मविश्वास का स्तर (डिफ़ॉल्ट मान 0.95 है)
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण: आर में कॉन्फिट() फ़ंक्शन का उपयोग कैसे करें
मान लीजिए कि हमारे पास आर में निम्नलिखित डेटा फ्रेम है जो अध्ययन में बिताए गए घंटों की संख्या, ली गई अभ्यास परीक्षाओं की संख्या और कक्षा में 10 छात्रों के अंतिम परीक्षा स्कोर को दर्शाता है:
#create data frame df <- data. frame (score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94), hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3), prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4)) #view data frame df score hours prac_exams 1 77 1 2 2 79 1 3 3 84 2 3 4 85 3 2 5 88 2 4 6 99 4 5 7 95 4 4 8 90 2 3 9 92 3 5 10 94 3 4
अब मान लीजिए कि हम निम्नलिखित एकाधिक रैखिक प्रतिगमन मॉडल को आर में फिट करना चाहते हैं:
परीक्षा स्कोर = β 0 + β 1 (घंटे) + β 2 (व्यावहारिक परीक्षा)
हम इस मॉडल को अनुकूलित करने के लिए lm() फ़ंक्शन का उपयोग कर सकते हैं:
#fit multiple linear regression model fit <- lm(score ~ hours + prac_exams, data=df) #view summary of model summary(fit) Call: lm(formula = score ~ hours + prac_exams, data = df) Residuals: Min 1Q Median 3Q Max -2.4324 -1.2632 -0.8956 0.4316 5.1412 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 68.4029 2.8723 23.815 5.85e-08 *** hours 4.1912 0.9961 4.207 0.0040 ** prac_exams 2.6912 0.9961 2.702 0.0306 * --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.535 on 7 degrees of freedom Multiple R-squared: 0.9005, Adjusted R-squared: 0.8721 F-statistic: 31.68 on 2 and 7 DF, p-value: 0.0003107
ध्यान दें कि मॉडल सारांश फिट किए गए प्रतिगमन गुणांक प्रदर्शित करता है:
- अवरोधन = 68.4029
- घंटे = 4.1912
- अभ्यास_परीक्षा = 2.6912
इनमें से प्रत्येक गुणांक के लिए 95% विश्वास अंतराल प्राप्त करने के लिए, हम कॉन्फ़िंट() फ़ंक्शन का उपयोग कर सकते हैं:
#calculate 95% confidence interval for each coefficient in model
confined(fit)
2.5% 97.5%
(Intercept) 61.6111102 75.194772
hours 1.8357237 6.546629
prac_exams 0.3357237 5.046629
प्रत्येक पैरामीटर के लिए 95% विश्वास अंतराल दर्शाया गया है:
- अवरोधन के लिए 95% सीआई = [61.61, 75.19]
- घंटों के लिए 95% सीआई = [1.84, 6.55]
- अभ्यास परीक्षा के लिए 95% सीआई = [0.34, 5.05]
99% विश्वास अंतराल की गणना करने के लिए, बस स्तर तर्क का मान बदलें:
#calculate 99% confidence interval for each coefficient in model confint(fit, level= 0.99 ) 0.5% 99.5% (Intercept) 58.3514926 78.454390 hours 0.7052664 7.677087 prac_exams -0.7947336 6.177087
और किसी विशिष्ट पैरामीटर के लिए केवल विश्वास अंतराल की गणना करने के लिए, बस पार्म तर्क का उपयोग करके गुणांक निर्दिष्ट करें:
#calculate 99% confidence interval for hours confint(fit, parm=' hours ', level= 0.99 ) 0.5% 99.5% hours 0.7052664 7.677087
ध्यान दें कि 99% विश्वास अंतराल केवल घंटे चर के लिए दिखाया गया है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल आर में रैखिक प्रतिगमन के बारे में अतिरिक्त जानकारी प्रदान करते हैं:
आर में प्रतिगमन आउटपुट की व्याख्या कैसे करें
आर में सरल रैखिक प्रतिगमन कैसे करें
आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
आर में लॉजिस्टिक रिग्रेशन कैसे करें