A- logistic regression model တစ်ခုတွင် odds အချိုးများကို တွက်ချက်နည်း


Logistic regression သည် response variable binary ဖြစ်သောအခါ regression model နှင့် ကိုက်ညီရန် ကျွန်ုပ်တို့သုံးနိုင်သော method တစ်ခုဖြစ်သည်။

R တွင် logistic regression model ကို အံကိုက်လိုက်သောအခါ၊ မော်ဒယ်အကျဉ်းချုပ်ရှိ ကိန်းဂဏန်းများသည် ခန့်မှန်းသူကိန်းရှင်တစ်ခုစီတွင် တစ်ယူနစ်တိုးလာခြင်းနှင့် ဆက်စပ်နေသော တုံ့ပြန်မှုကိန်းရှင်၏ မှတ်တမ်း၏ ပျမ်းမျှပြောင်းလဲမှုကို ကိုယ်စားပြုသည်။

သို့သော်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်ရှိ ခန့်မှန်းသူ ကိန်းရှင်များအတွက် ထူးထူးခြားခြား အချိုးအစားကို မကြာခဏ တွက်ချက်လိုပါသည်။

မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းသူ ကိန်းရှင်တစ်ခုစီအတွက် ထူးထူးခြားခြား အချိုးများကို အမြန်တွက်ချက်ရန်၊ အောက်ပါ syntax ကို သင်သုံးနိုင်သည်-

 exp(coef(model))

အောက်ဖော်ပြပါ အထားအသိုကို အသုံးပြု၍ ပေါက်ကြားမှုအချိုးတစ်ခုစီအတွက် 95% ယုံကြည်မှုကြားကာလကိုလည်း တွက်ချက်နိုင်သည်။

 exp(cbind(Odds_Ratio = coef(model), confint(model)))

အောက်ဖော်ပြပါ ဥပမာသည် R တွင် logistic regression model အတွက် odds အချိုးများကို တွက်ချက်ပြီး အဓိပ္ပါယ်ပြန်ဆိုရန် ဤ syntax ကို အသုံးပြုပုံကို ပြထားသည်။

ဥပမာ- R ဖြင့် Logistic Regression Model တွင် မတိုးနိုင်သော အချိုးများကို တွက်ချက်ခြင်း။

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် R ရှိ ISLR ပက်ကေ့ခ်ျမှ မူရင်း ဒေတာအစုံကို အသုံးပြုပါမည်။

ဒေတာအတွဲ၏ အကျဉ်းချုပ်ကို တင်ရန်နှင့် ပြသရန် အောက်ပါကုဒ်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်ပါသည်။

 library (ISLR)

#view first five rows of Default dataset
head(Default)

  default student balance income
1 No No 729.5265 44361.625
2 No Yes 817.1804 12106.135
3 No No 1073.5492 31767.139
4 No No 529.2506 35704.494
5 No No 785.6559 38463.496
6 No Yes 919.5885 7491.559

ဤဒေတာအတွဲတွင် လူ 10,000 ဦးအတွက် အောက်ပါအချက်အလက်များပါရှိသည်။

  • ပုံသေ- တစ်ဦးတစ်ယောက်သည် ပုံသေသတ်မှတ်ထားခြင်း ရှိ၊ မရှိကို ဖော်ပြသည်။
  • ကျောင်းသား- တစ်ဦးတစ်ယောက်သည် ကျောင်းသားဟုတ်မဟုတ် ညွှန်ပြသည်။
  • လက်ကျန်- တစ်ဦးချင်းစီမှ ပျမ်းမျှလက်ကျန်ငွေ။
  • ဝင်ငွေ- တစ်ဦးချင်း၏ ၀င်ငွေ။

ကျွန်ုပ်တို့သည် ကျောင်းသားအခြေအနေ၊ ဘဏ်လက်ကျန်နှင့် ဝင်ငွေတို့ကို အသုံးပြုပြီး ထောက်ပံ့ပို့ဆောင်ပေးသူတစ်ဦးသည် ပုံသေဖြစ်နိုင်ခြေကို ခန့်မှန်းပေးသည့် ထောက်ပံ့ပို့ဆောင်ရေးဆုတ်ယုတ်မှုပုံစံကို တည်ဆောက်မည်ဖြစ်သည်။

ကျွန်ုပ်တို့သည် glm လုပ်ဆောင်ချက်ကို အသုံးပြုပြီး family=’binomial’ ကို သတ်မှတ်နိုင်သည်၊ သို့မှသာ R သည် ဒေတာအစုနှင့် ထောက်ပံ့ပို့ဆောင်ရေးဆိုင်ရာ ဆုတ်ယုတ်မှုပုံစံနှင့် ကိုက်ညီမှုရှိသည်-

 #fit logistic regression model
model <- glm(default~student+balance+income, family=' binomial ', data=Default)

#disable scientific notation for model summary
options(scipen=999)

#view model summary
summary(model)

Call:
glm(formula = default ~ student + balance + income, family = "binomial", 
    data = train)

Deviance Residuals: 
    Min 1Q Median 3Q Max  
-2.5586 -0.1353 -0.0519 -0.0177 3.7973  

Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept) -11.478101194 0.623409555 -18.412 <0.0000000000000002 ***
studentYes -0.493292438 0.285735949 -1.726 0.0843 .  
balance 0.005988059 0.000293765 20.384 <0.0000000000000002 ***
income 0.000007857 0.000009965 0.788 0.4304    
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2021.1 on 6963 degrees of freedom
Residual deviance: 1065.4 on 6960 degrees of freedom
AIC: 1073.4

Number of Fisher Scoring iterations: 8

ရလဒ်ရှိ ကိန်းဂဏန်းများသည် ပုံသေမှတ်တမ်း၏ ပျမ်းမျှပြောင်းလဲမှုကို ညွှန်ပြသည်။

ဥပမာအားဖြင့်၊ လက်ကျန် တစ်ယူနစ်တိုးခြင်းသည် ပုံသေမှတ်တမ်းဖြစ်နိုင်ခြေတွင် ပျမ်းမျှ 0.005988 တိုးခြင်းနှင့် ဆက်စပ်နေသည်။

ခန့်မှန်းသူ variable တစ်ခုစီအတွက် odds အချိုးအစား တွက်ချက်ရန်၊ အောက်ပါ syntax ကို အသုံးပြုနိုင်ပါသည်။

 #calculate odds ratio for each predictor variable
exp(coef(model))

  (Intercept) studentYes balance income 
0.00001903854 0.52373166965 1.00575299051 1.00000303345 

ပေါက်ကြားမှုအချိုးတစ်ခုစီနှင့် လေးနက်မှုအချိုးတစ်ခုစီအတွက် 95% ယုံကြည်မှုကြားကာလကိုလည်း တွက်ချက်နိုင်သည်-

 #calculate odds ratio and 95% confidence interval for each predictor variable 
exp(cbind(Odds_Ratio = coef(model), confint(model)))

               Odds_Ratio 2.5% 97.5%
(Intercept) 0.00001903854 0.000007074481 0.0000487808
studentYes 0.52373166965 0.329882707270 0.8334223982
balance 1.00575299051 1.005308940686 1.0062238757
income 1.00000303345 0.999986952969 1.0000191246

ကိန်းဂဏန်းတစ်ခုစီအတွက် အတိုးနှုန်းအချိုးသည် အခြားကြိုတင်ခန့်မှန်းသူကိန်းရှင်များအားလုံးကို အမြဲမပြတ်ရှိနေသည်ဟု ယူဆကာ တစ်ဦးချင်းစီ၏ ပုံသေဖြစ်နိုင်ခြေများ ပျမ်းမျှတိုးလာမှုကို ကိုယ်စားပြုသည်။

ဥပမာအားဖြင့်၊ ကြိုတင်ခန့်မှန်းကိန်းရှင်၏ ချိန်ခွင်လျှာသည် 1.0057 အချိုးအစားရှိသည်။

ဆိုလိုသည်မှာ တစ်ဦးချင်းစီ သယ်ဆောင်သည့် လက်ကျန်ငွေလက်ကျန်ရှိ နောက်ထပ်ဒေါ်လာတိုင်းအတွက်၊ တစ်ဦးချင်းစီသည် ၎င်းတို့၏ ချေးငွေအပေါ် ပုံသေရမည့်အချက် 1.0057 ဖြင့် တိုးလာမည်ဖြစ်ပြီး ကျောင်းသားအခြေအနေနှင့် ဝင်ငွေသည် ကိန်းသေရှိနေသည်ဟုဆိုလိုသည်

ကျွန်ုပ်တို့သည် အခြားကြိုတင်ခန့်မှန်းကိန်းရှင်များအတွက် ထူးထူးခြားခြား အချိုးများကို တူညီသောနည်းဖြင့် ဘာသာပြန်ဆိုနိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် R တွင် အခြားဘုံအလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

R တွင် logistic regression model ဖြင့် Predict() ကိုအသုံးပြုနည်း
R တွင် logistic regression output တွင် Pr(>|z|) ကို မည်သို့အဓိပ္ပာယ်ဖွင့်မည်နည်း။
R တွင် logistic regression curve ကို ဘယ်လိုဆွဲမလဲ။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်