R တွင် glm နှင့် lm ကွာခြားချက်


R programming language သည် linear model များနှင့် လိုက်ဖက်သော အောက်ပါလုပ်ဆောင်ချက်များကို ပံ့ပိုးပေးသည်-

1. lm – linear မော်ဒယ်များနှင့် ကိုက်ညီရန် အသုံးပြုသည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-

lm(ဖော်မြူလာ၊ ဒေတာ၊ …)

ရွှေ-

  • ဖော်မြူလာ- linear model ဖော်မြူလာ (ဥပမာ y ~ x1 + x2)
  • ဒေတာ- ဒေတာပါရှိသော ဒေတာဘလောက်၏ အမည်

2. glm – ယေဘူယျအားဖြင့် မျဉ်းဖြောင့်မော်ဒယ်များနှင့် ကိုက်ညီရန် အသုံးပြုသည်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-

glm(ဖော်မြူလာ၊ မိသားစု= Gaussian၊ ဒေတာ၊ …)

ရွှေ-

  • ဖော်မြူလာ- linear model ဖော်မြူလာ (ဥပမာ y ~ x1 + x2)
  • မိသားစု- မော်ဒယ်နှင့်ကိုက်ညီရန် အသုံးပြုရန် ကိန်းဂဏန်းမိသားစု။ မူရင်းမှာ Gaussian ဖြစ်သည်၊ သို့သော် အခြားရွေးချယ်စရာများမှာ Binomial၊ Gamma နှင့် Poisson တို့ဖြစ်သည်။
  • ဒေတာ- ဒေတာပါရှိသော ဒေတာဘလောက်၏ အမည်

ဤလုပ်ဆောင်ချက်နှစ်ခုကြားမှ တစ်ခုတည်းသော ကွာခြားချက်မှာ glm() လုပ်ဆောင်ချက်တွင် ထည့်သွင်းထားသော မိသားစု အငြင်းအခုံဖြစ်သည်။

linear regression model ကို အံဝင်ခွင်ကျဖြစ်အောင် lm() သို့မဟုတ် glm() ကိုအသုံးပြုပါက၊ ၎င်းတို့သည် အတိအကျတူညီသောရလဒ်များကို ထုတ်ပေးမည်ဖြစ်ပါသည်

သို့သော်လည်း၊ glm() လုပ်ဆောင်ချက်ကို အောက်ပါကဲ့သို့သော ပိုမိုရှုပ်ထွေးသော မော်ဒယ်များနှင့် ကိုက်ညီရန် အသုံးပြုနိုင်သည်။

အောက်ဖော်ပြပါ ဥပမာများသည် လက်တွေ့တွင် lm() နှင့် glm() လုပ်ဆောင်ချက်များကို အသုံးပြုနည်းကို ပြသထားသည်။

lm() function ကိုအသုံးပြုခြင်း ဥပမာ

အောက်ပါကုဒ်သည် lm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ linear regression model တစ်ခုအား မည်ကဲ့သို့ အံဝင်ခွင်ကျဖြစ်စေရန် ဖော်ပြသည်-

 #fit multiple linear regression model
model <- lm(mpg ~ disp + hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

glm() လုပ်ဆောင်ချက်ကို အသုံးပြုခြင်း ဥပမာများ

အောက်ပါကုဒ်သည် glm() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ အတိအကျတူညီသော linear regression model ကို မည်သို့ကိုက်ညီရမည်ကို ပြသသည်-

 #fit multiple linear regression model
model <- glm(mpg ~ disp + hp, data=mtcars)

#view model summary
summary(model)

Call:
glm(formula = mpg ~ disp + hp, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-4.7945 -2.3036 -0.8246 1.8582 6.9363  

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for gaussian family taken to be 9.775636)

    Null deviance: 1126.05 on 31 degrees of freedom
Residual deviance: 283.49 on 29 degrees of freedom
AIC: 168.62

Number of Fisher Scoring iterations: 2

coefficient ခန့်မှန်းချက်များနှင့် coefficient ခန့်မှန်းချက်များ၏ စံအမှားများသည် lm() လုပ်ဆောင်ချက်မှ ထုတ်လုပ်သည့်အရာများနှင့် အတိအကျတူညီကြောင်း သတိပြုပါ။

family=binomial ကို အောက်ပါအတိုင်း သတ်မှတ်ခြင်းဖြင့် logistic regression model ကို အံဝင်ခွင်ကျဖြစ်စေရန်အတွက် glm() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်ကြောင်း သတိပြုပါ။

 #fit logistic regression model
model <- glm(am ~ disp + hp, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + hp, family = binomial, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.9665 -0.3090 -0.0017 0.3934 1.3682  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)  
(Intercept) 1.40342 1.36757 1.026 0.3048  
available -0.09518 0.04800 -1.983 0.0474 *
hp 0.12170 0.06777 1.796 0.0725 .
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43,230 on 31 degrees of freedom
Residual deviance: 16,713 on 29 degrees of freedom
AIC: 22,713

Number of Fisher Scoring iterations: 8

မိသားစု = poisson ကို အောက်ပါအတိုင်း သတ်မှတ်ခြင်းဖြင့် Poisson ဆုတ်ယုတ်မှုပုံစံ နှင့် ကိုက်ညီရန် glm() လုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။

 #fit Poisson regression model
model <- glm(am ~ disp + hp, data=mtcars, family=fish)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + hp, family = fish, data = mtcars)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-1.1266 -0.4629 -0.2453 0.1797 1.5428  

Coefficients:
             Estimate Std. Error z value Pr(>|z|)   
(Intercept) 0.214255 0.593463 0.361 0.71808   
available -0.018915 0.007072 -2.674 0.00749 **
hp 0.016522 0.007163 2.307 0.02107 * 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for fish family taken to be 1)

    Null deviance: 23,420 on 31 degrees of freedom
Residual deviance: 10,526 on 29 degrees of freedom
AIC: 42,526

Number of Fisher Scoring iterations: 6

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် glm ဖြင့် ခန့်မှန်းသည့်လုပ်ဆောင်ချက်ကို မည်သို့အသုံးပြုရမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်