आर में निर्धारण का गुणांक (आर-वर्ग) कैसे ज्ञात करें
निर्धारण का गुणांक (आमतौर पर आर 2 दर्शाया जाता है) प्रतिक्रिया चर के विचरण का अनुपात है जिसे प्रतिगमन मॉडल में व्याख्यात्मक चर द्वारा समझाया जा सकता है।
यह ट्यूटोरियल R में एक प्रतिगमन मॉडल में R2 को खोजने और उसकी व्याख्या करने का एक उदाहरण प्रदान करता है।
संबंधित: एक अच्छा आर-वर्ग मान क्या है?
उदाहरण: आर में आर-स्क्वायर ढूंढना और व्याख्या करना
मान लीजिए कि हमारे पास निम्नलिखित डेटासेट है जिसमें अध्ययन किए गए घंटों की संख्या, ली गई प्रारंभिक परीक्षा और 15 छात्रों के लिए प्राप्त परीक्षा स्कोर का डेटा शामिल है:
#create data frame df <- data.frame(hours=c(1, 2, 2, 4, 2, 1, 5, 4, 2, 4, 4, 3, 6, 5, 3), prep_exams=c(1, 3, 3, 5, 2, 2, 1, 1, 0, 3, 4, 3, 2, 4, 4), score=c(76, 78, 85, 88, 72, 69, 94, 94, 88, 92, 90, 75, 96, 90, 82)) #view first six rows of data frame head(df) hours prep_exams score 1 1 1 76 2 2 3 78 3 2 3 85 4 4 5 88 5 2 2 72 6 1 2 69
निम्नलिखित कोड दिखाता है कि इस डेटासेट में एकाधिक रैखिक प्रतिगमन मॉडल को कैसे फिट किया जाए और मॉडल आउटपुट को आर में कैसे प्रदर्शित किया जाए:
#fit regression model model <- lm(score~hours+prep_exams, data=df) #view model summary summary(model) Call: lm(formula = score ~ hours + prep_exams, data = df) Residuals: Min 1Q Median 3Q Max -7.9896 -2.5514 0.3079 3.3370 7.0352 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 71.8078 3.5222 20.387 1.12e-10 *** hours 5.0247 0.8964 5.606 0.000115 *** prep_exams -1.2975 0.9689 -1.339 0.205339 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 4.944 on 12 degrees of freedom Multiple R-squared: 0.7237, Adjusted R-squared: 0.6776 F-statistic: 15.71 on 2 and 12 DF, p-value: 0.0004454
मॉडल का आर-वर्ग (आउटपुट के बिल्कुल नीचे दिखाया गया) 0.7237 निकला।
इसका मतलब यह है कि परीक्षा के अंकों में 72.37% भिन्नता को अध्ययन किए गए घंटों की संख्या और ली गई अभ्यास परीक्षाओं की संख्या से समझाया जा सकता है।
ध्यान दें कि आप निम्नलिखित सिंटैक्स का उपयोग करके भी इस मान तक पहुंच सकते हैं:
summary(model)$r.squared [1] 0.7236545
आर-वर्ग मान की व्याख्या कैसे करें
एक R वर्ग मान हमेशा 0 और 1 के बीच होगा।
1 का मान इंगित करता है कि व्याख्यात्मक चर प्रतिक्रिया चर के भिन्नता को पूरी तरह से समझा सकते हैं और 0 का मान इंगित करता है कि व्याख्यात्मक चर में प्रतिक्रिया चर के भिन्नता को समझाने की क्षमता नहीं है।
सामान्य तौर पर, प्रतिगमन मॉडल का आर-वर्ग मान जितना बड़ा होगा, व्याख्यात्मक चर उतना ही बेहतर प्रतिक्रिया चर के मूल्य की भविष्यवाणी करने में सक्षम होंगे।
यह निर्धारित करने के तरीके के बारे में अधिक जानकारी के लिए इस लेख को देखें कि किसी दिए गए आर-वर्ग मान को किसी दिए गए प्रतिगमन मॉडल के लिए “अच्छा” माना जाता है या नहीं।