आर में निर्धारण का गुणांक (आर-वर्ग) कैसे ज्ञात करें


निर्धारण का गुणांक (आमतौर पर आर 2 दर्शाया जाता है) प्रतिक्रिया चर के विचरण का अनुपात है जिसे प्रतिगमन मॉडल में व्याख्यात्मक चर द्वारा समझाया जा सकता है।

यह ट्यूटोरियल R में एक प्रतिगमन मॉडल में R2 को खोजने और उसकी व्याख्या करने का एक उदाहरण प्रदान करता है।

संबंधित: एक अच्छा आर-वर्ग मान क्या है?

उदाहरण: आर में आर-स्क्वायर ढूंढना और व्याख्या करना

मान लीजिए कि हमारे पास निम्नलिखित डेटासेट है जिसमें अध्ययन किए गए घंटों की संख्या, ली गई प्रारंभिक परीक्षा और 15 छात्रों के लिए प्राप्त परीक्षा स्कोर का डेटा शामिल है:

 #create data frame
df <- data.frame(hours=c(1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3),
                 prep_exams=c(1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4),
                 score=c(76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82))

#view first six rows of data frame
head(df)

  hours prep_exams score
1 1 1 76
2 2 3 78
3 2 3 85
4 4 5 88
5 2 2 72
6 1 2 69

निम्नलिखित कोड दिखाता है कि इस डेटासेट में एकाधिक रैखिक प्रतिगमन मॉडल को कैसे फिट किया जाए और मॉडल आउटपुट को आर में कैसे प्रदर्शित किया जाए:

 #fit regression model
model <- lm(score~hours+prep_exams, data=df)

#view model summary
summary(model)

Call:
lm(formula = score ~ hours + prep_exams, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-7.9896 -2.5514 0.3079 3.3370 7.0352 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 71.8078 3.5222 20.387 1.12e-10 ***
hours 5.0247 0.8964 5.606 0.000115 ***
prep_exams -1.2975 0.9689 -1.339 0.205339    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.944 on 12 degrees of freedom
Multiple R-squared: 0.7237, Adjusted R-squared: 0.6776 
F-statistic: 15.71 on 2 and 12 DF, p-value: 0.0004454

मॉडल का आर-वर्ग (आउटपुट के बिल्कुल नीचे दिखाया गया) 0.7237 निकला।

इसका मतलब यह है कि परीक्षा के अंकों में 72.37% भिन्नता को अध्ययन किए गए घंटों की संख्या और ली गई अभ्यास परीक्षाओं की संख्या से समझाया जा सकता है।

ध्यान दें कि आप निम्नलिखित सिंटैक्स का उपयोग करके भी इस मान तक पहुंच सकते हैं:

 summary(model)$r.squared

[1] 0.7236545

आर-वर्ग मान की व्याख्या कैसे करें

एक R वर्ग मान हमेशा 0 और 1 के बीच होगा।

1 का मान इंगित करता है कि व्याख्यात्मक चर प्रतिक्रिया चर के भिन्नता को पूरी तरह से समझा सकते हैं और 0 का मान इंगित करता है कि व्याख्यात्मक चर में प्रतिक्रिया चर के भिन्नता को समझाने की क्षमता नहीं है।

सामान्य तौर पर, प्रतिगमन मॉडल का आर-वर्ग मान जितना बड़ा होगा, व्याख्यात्मक चर उतना ही बेहतर प्रतिक्रिया चर के मूल्य की भविष्यवाणी करने में सक्षम होंगे।

यह निर्धारित करने के तरीके के बारे में अधिक जानकारी के लिए इस लेख को देखें कि किसी दिए गए आर-वर्ग मान को किसी दिए गए प्रतिगमन मॉडल के लिए “अच्छा” माना जाता है या नहीं।

संबंधित: आर में समायोजित आर-वर्ग की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *