R တွင် glm နှင့် lm ကွာခြားချက်
R programming language သည် linear model များနှင့် လိုက်ဖက်သော အောက်ပါလုပ်ဆောင်ချက်များကို ပံ့ပိုးပေးသည်-
1. lm – linear မော်ဒယ်များနှင့် ကိုက်ညီရန် အသုံးပြုသည်။
ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-
lm(ဖော်မြူလာ၊ ဒေတာ၊ …)
ရွှေ-
- ဖော်မြူလာ- linear model ဖော်မြူလာ (ဥပမာ y ~ x1 + x2)
- ဒေတာ- ဒေတာပါရှိသော ဒေတာဘလောက်၏ အမည်
2. glm – ယေဘူယျအားဖြင့် မျဉ်းဖြောင့်မော်ဒယ်များနှင့် ကိုက်ညီရန် အသုံးပြုသည်။
ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-
glm(ဖော်မြူလာ၊ မိသားစု= Gaussian၊ ဒေတာ၊ …)
ရွှေ-
- ဖော်မြူလာ- linear model ဖော်မြူလာ (ဥပမာ y ~ x1 + x2)
- မိသားစု- မော်ဒယ်နှင့်ကိုက်ညီရန် အသုံးပြုရန် ကိန်းဂဏန်းမိသားစု။ မူရင်းမှာ Gaussian ဖြစ်သည်၊ သို့သော် အခြားရွေးချယ်စရာများမှာ Binomial၊ Gamma နှင့် Poisson တို့ဖြစ်သည်။
- ဒေတာ- ဒေတာပါရှိသော ဒေတာဘလောက်၏ အမည်
ဤလုပ်ဆောင်ချက်နှစ်ခုကြားမှ တစ်ခုတည်းသော ကွာခြားချက်မှာ glm() လုပ်ဆောင်ချက်တွင် ထည့်သွင်းထားသော မိသားစု အငြင်းအခုံဖြစ်သည်။
linear regression model ကို အံဝင်ခွင်ကျဖြစ်အောင် lm() သို့မဟုတ် glm() ကိုအသုံးပြုပါက၊ ၎င်းတို့သည် အတိအကျတူညီသောရလဒ်များကို ထုတ်ပေးမည်ဖြစ်ပါသည် ။
သို့သော်လည်း၊ glm() လုပ်ဆောင်ချက်ကို အောက်ပါကဲ့သို့သော ပိုမိုရှုပ်ထွေးသော မော်ဒယ်များနှင့် ကိုက်ညီရန် အသုံးပြုနိုင်သည်။
- ထောက်ပံ့ပို့ဆောင်ရေး ဆုတ်ယုတ်မှု (family=binomial)
- Poisson ဆုတ်ယုတ်မှု (မိသားစု = ငါး)
အောက်ဖော်ပြပါ ဥပမာများသည် လက်တွေ့တွင် lm() နှင့် glm() လုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ပြသထားသည်။
lm() function ကိုအသုံးပြုခြင်း ဥပမာ
အောက်ပါကုဒ်သည် lm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ linear regression model တစ်ခုအား မည်ကဲ့သို့ အံဝင်ခွင်ကျဖြစ်စေရန် ဖော်ပြသည်-
#fit multiple linear regression model model <- lm(mpg ~ disp + hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
glm() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်း ဥပမာများ
အောက်ပါကုဒ်သည် glm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ အတိအကျတူညီသော linear regression model ကို မည်သို့ကိုက်ညီရမည်ကို ပြသသည်-
#fit multiple linear regression model model <- glm(mpg ~ disp + hp, data=mtcars) #view model summary summary(model) Call: glm(formula = mpg ~ disp + hp, data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for gaussian family taken to be 9.775636) Null deviance: 1126.05 on 31 degrees of freedom Residual deviance: 283.49 on 29 degrees of freedom AIC: 168.62 Number of Fisher Scoring iterations: 2
coefficient ခန့်မှန်းချက်များနှင့် coefficient ခန့်မှန်းချက်များ၏ စံအမှားများသည် lm() လုပ်ဆောင်ချက်မှ ထုတ်လုပ်သည့်အရာများနှင့် အတိအကျတူညီကြောင်း သတိပြုပါ။
family=binomial ကို အောက်ပါအတိုင်း သတ်မှတ်ခြင်းဖြင့် logistic regression model ကို အံဝင်ခွင်ကျဖြစ်စေရန်အတွက် glm() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ကြောင်း သတိပြုပါ။
#fit logistic regression model model <- glm(am ~ disp + hp, data=mtcars, family=binomial) #view model summary summary(model) Call: glm(formula = am ~ disp + hp, family = binomial, data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -1.9665 -0.3090 -0.0017 0.3934 1.3682 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.40342 1.36757 1.026 0.3048 available -0.09518 0.04800 -1.983 0.0474 * hp 0.12170 0.06777 1.796 0.0725 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 43,230 on 31 degrees of freedom Residual deviance: 16,713 on 29 degrees of freedom AIC: 22,713 Number of Fisher Scoring iterations: 8
မိသားစု = poisson ကို အောက်ပါအတိုင်း သတ်မှတ်ခြင်းဖြင့် Poisson ဆုတ်ယုတ်မှုပုံစံ နှင့် ကိုက်ညီရန် glm() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။
#fit Poisson regression model model <- glm(am ~ disp + hp, data=mtcars, family=fish) #view model summary summary(model) Call: glm(formula = am ~ disp + hp, family = fish, data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -1.1266 -0.4629 -0.2453 0.1797 1.5428 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.214255 0.593463 0.361 0.71808 available -0.018915 0.007072 -2.674 0.00749 ** hp 0.016522 0.007163 2.307 0.02107 * --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for fish family taken to be 1) Null deviance: 23,420 on 31 degrees of freedom Residual deviance: 10,526 on 29 degrees of freedom AIC: 42,526 Number of Fisher Scoring iterations: 6
ထပ်လောင်းအရင်းအမြစ်များ
R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် glm ဖြင့် ခန့်မှန်းသည့်လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။