R में कॉन्फिट() फ़ंक्शन का उपयोग कैसे करें


फिटेड रिग्रेशन मॉडल में एक या अधिक मापदंडों के लिए कॉन्फिडेंस अंतराल की गणना करने के लिए आप आर में कॉन्फ़िंट() फ़ंक्शन का उपयोग कर सकते हैं।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

कॉन्फ़िंट (वस्तु, परम, स्तर = 0.95)

सोना:

  • वस्तु : फिट किए गए प्रतिगमन मॉडल का नाम
  • पर्म : पैरामीटर जिसके लिए आत्मविश्वास अंतराल की गणना की जाती है (डिफ़ॉल्ट सभी है)
  • स्तर : उपयोग करने के लिए आत्मविश्वास का स्तर (डिफ़ॉल्ट मान 0.95 है)

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण: आर में कॉन्फिट() फ़ंक्शन का उपयोग कैसे करें

मान लीजिए कि हमारे पास आर में निम्नलिखित डेटा फ्रेम है जो अध्ययन में बिताए गए घंटों की संख्या, ली गई अभ्यास परीक्षाओं की संख्या और कक्षा में 10 छात्रों के अंतिम परीक्षा स्कोर को दर्शाता है:

 #create data frame
df <- data. frame (score=c(77, 79, 84, 85, 88, 99, 95, 90, 92, 94),
                 hours=c(1, 1, 2, 3, 2, 4, 4, 2, 3, 3),
                 prac_exams=c(2, 3, 3, 2, 4, 5, 4, 3, 5, 4))

#view data frame
df

   score hours prac_exams
1 77 1 2
2 79 1 3
3 84 2 3
4 85 3 2
5 88 2 4
6 99 4 5
7 95 4 4
8 90 2 3
9 92 3 5
10 94 3 4

अब मान लीजिए कि हम निम्नलिखित एकाधिक रैखिक प्रतिगमन मॉडल को आर में फिट करना चाहते हैं:

परीक्षा स्कोर = β 0 + β 1 (घंटे) + β 2 (व्यावहारिक परीक्षा)

हम इस मॉडल को अनुकूलित करने के लिए lm() फ़ंक्शन का उपयोग कर सकते हैं:

 #fit multiple linear regression model
fit <- lm(score ~ hours + prac_exams, data=df)

#view summary of model
summary(fit)

Call:
lm(formula = score ~ hours + prac_exams, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-2.4324 -1.2632 -0.8956 0.4316 5.1412 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 68.4029 2.8723 23.815 5.85e-08 ***
hours 4.1912 0.9961 4.207 0.0040 ** 
prac_exams 2.6912 0.9961 2.702 0.0306 *  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.535 on 7 degrees of freedom
Multiple R-squared: 0.9005, Adjusted R-squared: 0.8721 
F-statistic: 31.68 on 2 and 7 DF, p-value: 0.0003107

ध्यान दें कि मॉडल सारांश फिट किए गए प्रतिगमन गुणांक प्रदर्शित करता है:

  • अवरोधन = 68.4029
  • घंटे = 4.1912
  • अभ्यास_परीक्षा = 2.6912

इनमें से प्रत्येक गुणांक के लिए 95% विश्वास अंतराल प्राप्त करने के लिए, हम कॉन्फ़िंट() फ़ंक्शन का उपयोग कर सकते हैं:

 #calculate 95% confidence interval for each coefficient in model
confined(fit)

                 2.5% 97.5%
(Intercept) 61.6111102 75.194772
hours 1.8357237 6.546629
prac_exams 0.3357237 5.046629

प्रत्येक पैरामीटर के लिए 95% विश्वास अंतराल दर्शाया गया है:

  • अवरोधन के लिए 95% सीआई = [61.61, 75.19]
  • घंटों के लिए 95% सीआई = [1.84, 6.55]
  • अभ्यास परीक्षा के लिए 95% सीआई = [0.34, 5.05]

99% विश्वास अंतराल की गणना करने के लिए, बस स्तर तर्क का मान बदलें:

 #calculate 99% confidence interval for each coefficient in model
confint(fit, level= 0.99 )

                 0.5% 99.5%
(Intercept) 58.3514926 78.454390
hours 0.7052664 7.677087
prac_exams -0.7947336 6.177087

और किसी विशिष्ट पैरामीटर के लिए केवल विश्वास अंतराल की गणना करने के लिए, बस पार्म तर्क का उपयोग करके गुणांक निर्दिष्ट करें:

 #calculate 99% confidence interval for hours
confint(fit, parm=' hours ', level= 0.99 )

          0.5% 99.5%
hours 0.7052664 7.677087

ध्यान दें कि 99% विश्वास अंतराल केवल घंटे चर के लिए दिखाया गया है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल आर में रैखिक प्रतिगमन के बारे में अतिरिक्त जानकारी प्रदान करते हैं:

आर में प्रतिगमन आउटपुट की व्याख्या कैसे करें
आर में सरल रैखिक प्रतिगमन कैसे करें
आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
आर में लॉजिस्टिक रिग्रेशन कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *