आर में जीएलएम और एलएम के बीच अंतर
आर प्रोग्रामिंग भाषा रैखिक मॉडल फिट करने के लिए निम्नलिखित कार्य प्रदान करती है:
1. एलएम – रैखिक मॉडल फिट करने के लिए उपयोग किया जाता है
यह फ़ंक्शन निम्नलिखित सिंटैक्स का उपयोग करता है:
एलएम(सूत्र, डेटा,…)
सोना:
- सूत्र: रैखिक मॉडल सूत्र (जैसे y ~ x1 + x2)
- डेटा: डेटा ब्लॉक का नाम जिसमें डेटा है
2. जीएलएम – सामान्यीकृत रैखिक मॉडल फिट करने के लिए उपयोग किया जाता है
यह फ़ंक्शन निम्नलिखित सिंटैक्स का उपयोग करता है:
जीएलएम(सूत्र, परिवार=गाऊसी, डेटा,…)
सोना:
- सूत्र: रैखिक मॉडल सूत्र (जैसे y ~ x1 + x2)
- परिवार: मॉडल को फिट करने के लिए उपयोग किया जाने वाला सांख्यिकीय परिवार। डिफ़ॉल्ट गॉसियन है, लेकिन अन्य विकल्पों में द्विपद, गामा और पॉइसन शामिल हैं।
- डेटा: डेटा ब्लॉक का नाम जिसमें डेटा है
ध्यान दें कि इन दोनों फ़ंक्शंस के बीच एकमात्र अंतर glm() फ़ंक्शन में शामिल पारिवारिक तर्क है।
यदि आप एक रेखीय प्रतिगमन मॉडल को फिट करने के लिए lm() या glm() का उपयोग करते हैं, तो वे बिल्कुल वही परिणाम देंगे ।
हालाँकि, glm() फ़ंक्शन का उपयोग अधिक जटिल मॉडलों को फिट करने के लिए भी किया जा सकता है जैसे:
- लॉजिस्टिक रिग्रेशन (परिवार=द्विपद)
- पॉइसन प्रतिगमन (परिवार=मछली)
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में lm() और glm() फ़ंक्शंस का उपयोग कैसे करें।
एलएम() फ़ंक्शन का उपयोग करने का उदाहरण
निम्नलिखित कोड दिखाता है कि lm() फ़ंक्शन का उपयोग करके एक रैखिक प्रतिगमन मॉडल को कैसे फिट किया जाए:
#fit multiple linear regression model model <- lm(mpg ~ disp + hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Glm() फ़ंक्शन का उपयोग करने के उदाहरण
निम्नलिखित कोड दिखाता है कि glm() फ़ंक्शन का उपयोग करके बिल्कुल उसी रैखिक प्रतिगमन मॉडल को कैसे फिट किया जाए:
#fit multiple linear regression model model <- glm(mpg ~ disp + hp, data=mtcars) #view model summary summary(model) Call: glm(formula = mpg ~ disp + hp, data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for gaussian family taken to be 9.775636) Null deviance: 1126.05 on 31 degrees of freedom Residual deviance: 283.49 on 29 degrees of freedom AIC: 168.62 Number of Fisher Scoring iterations: 2
ध्यान दें कि गुणांक अनुमान और गुणांक अनुमान की मानक त्रुटियां बिल्कुल वही हैं जो एलएम() फ़ंक्शन द्वारा उत्पादित की जाती हैं।
ध्यान दें कि हम परिवार = द्विपद को निम्नानुसार निर्दिष्ट करके लॉजिस्टिक रिग्रेशन मॉडल को फिट करने के लिए glm() फ़ंक्शन का भी उपयोग कर सकते हैं:
#fit logistic regression model model <- glm(am ~ disp + hp, data=mtcars, family=binomial) #view model summary summary(model) Call: glm(formula = am ~ disp + hp, family = binomial, data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -1.9665 -0.3090 -0.0017 0.3934 1.3682 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.40342 1.36757 1.026 0.3048 available -0.09518 0.04800 -1.983 0.0474 * hp 0.12170 0.06777 1.796 0.0725 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 43,230 on 31 degrees of freedom Residual deviance: 16,713 on 29 degrees of freedom AIC: 22,713 Number of Fisher Scoring iterations: 8
हम परिवार = पॉइसन को निम्नानुसार निर्दिष्ट करके पॉइसन प्रतिगमन मॉडल को फिट करने के लिए glm() फ़ंक्शन का भी उपयोग कर सकते हैं:
#fit Poisson regression model model <- glm(am ~ disp + hp, data=mtcars, family=fish) #view model summary summary(model) Call: glm(formula = am ~ disp + hp, family = fish, data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -1.1266 -0.4629 -0.2453 0.1797 1.5428 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.214255 0.593463 0.361 0.71808 available -0.018915 0.007072 -2.674 0.00749 ** hp 0.016522 0.007163 2.307 0.02107 * --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for fish family taken to be 1) Null deviance: 23,420 on 31 degrees of freedom Residual deviance: 10,526 on 29 degrees of freedom AIC: 42,526 Number of Fisher Scoring iterations: 6
अतिरिक्त संसाधन
आर में सरल रैखिक प्रतिगमन कैसे करें
आर में मल्टीपल लीनियर रिग्रेशन कैसे करें
R में glm के साथ पूर्वानुमान फ़ंक्शन का उपयोग कैसे करें