R တွင် ရောဂါရှာဖွေရေးကွက်များကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ
တစ်ပြေးညီ ဆုတ်ယုတ်မှုပုံစံများကို တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်တစ်ခုအကြား ဆက်နွယ်မှုကို ဖော်ပြရန်အတွက် အသုံးပြုသည်။
သို့သော်၊ ကျွန်ုပ်တို့သည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို တပ်ဆင်ပြီးသည်နှင့်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်အကြွင်းအကျန်များကို ပိုင်းခြားစိတ်ဖြာရန် ခွဲခြားစိတ်ဖြာရန် လမ်းကြောင်းများကို ထုတ်လုပ်ရန်နှင့် ကျွန်ုပ်တို့လုပ်ဆောင်နေသော သီးခြားဒေတာအတွက် အသုံးပြုရန် လိုင်းယာမော်ဒယ်သည် သင့်လျော်ကြောင်း သေချာစေရန် သင့်လျော်ပါသည်။
ဤသင်ခန်းစာသည် R တွင် ပေးထားသော ဆုတ်ယုတ်မှုပုံစံအတွက် ရောဂါရှာဖွေရေးကွက်များကို ဖန်တီးပြီး အဓိပ္ပာယ်ပြန်ဆိုနည်းကို ရှင်းပြထားသည်။
ဥပမာ- R တွင် ရောဂါရှာဖွေရေးကွက်များကို ဖန်တီးပြီး ဘာသာပြန်ပါ။
အချို့သော အတန်းတစ်ခုရှိ ကျောင်းသားများ၏ “ စာမေးပွဲအဆင့်” ကို ခန့်မှန်းရန် “ နာရီများ လေ့လာထားသည်” ကို အသုံးပြု၍ ရိုးရှင်းသော မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို တပ်ဆင်ထားသည်ဆိုပါစို့။
#create data frame df <- data. frame (hours=c(1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4, 5, 5, 6), score=c(67, 65, 68, 77, 73, 79, 81, 88, 80, 67, 84, 93, 90, 91)) #fit linear regression model model = lm(score ~ hours, data=df)
ဤဆုတ်ယုတ်မှုပုံစံအတွက် ရောဂါရှာဖွေရေးကွက်လေးခုကို ထုတ်လုပ်ရန် plot() command ကို အသုံးပြုနိုင်သည်။
#produce diagnostic plots for regression model
plot(model)

ရောဂါရှာဖွေရေးဇယား #1- အကြွင်းများနှင့် Leverage ဇယား
ဤဂရပ်ကို သြဇာကြီးမားသော လေ့လာတွေ့ရှိချက်များကို ဖော်ထုတ်ရန် အသုံးပြုသည်။ ဤဂရပ်ပေါ်ရှိ အမှတ်များ သည် Cook ၏ အကွာအဝေး (အစက်ချမျဉ်းများ) ၏ အပြင်ဘက်တွင် ကျရောက်ပါက၊ ၎င်းသည် သြဇာကြီးမားသော စူးစမ်းမှုတစ်ခုဖြစ်သည်။

ကျွန်ုပ်တို့၏ဥပမာတွင်၊ မှတ်သားမှု #10 သည် Cook အကွာအဝေးကန့်သတ်ချက်နှင့်အနီးဆုံးဖြစ်သည်ကိုတွေ့မြင်နိုင်သော်လည်း ၎င်းသည် အစက်ချမျဉ်းအပြင်ဘက်သို့ကျမသွားကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ ဆိုလိုသည်မှာ ကျွန်ုပ်တို့၏ဒေတာအတွဲတွင် အလွန်သြဇာညောင်းသောအချက်များမရှိပါ။
Diagnostic Plot #2- အတိုင်းအတာနှင့် တည်နေရာပြကွက်
ကျွန်ုပ်တို့၏ ဆုတ်ယုတ်မှုပုံစံ၏ အကြွင်းအကျန်များကြားတွင် ကွဲလွဲမှု (“ homoskedasticity” ဟုလည်း ခေါ်သည်) တန်းတူညီမျှမှု၏ ယူဆချက်ကို အတည်ပြုရန်အတွက် ဤဂရပ်ကို အသုံးပြုပါသည်။ အနီရောင်မျဉ်းသည် ကွက်ကွက်ပေါ်တွင် ခန့်မှန်းခြေအားဖြင့် အလျားလိုက်ဖြစ်နေပါက၊ တူညီသောကွဲလွဲမှု၏ ယူဆချက်နှင့် ကိုက်ညီနိုင်မည်ဖြစ်သည်။

ကျွန်ုပ်တို့၏ဥပမာတွင်၊ အနီရောင်မျဉ်းသည် ကွက်ကွက်ပေါ်တွင် အတိအကျ ရေပြင်ညီမဟုတ်ကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်၊ သို့သော် ၎င်းသည် မည်သည့်အချိန်တွင်မျှ အလွန်ရိုင်းစိုင်းစွာသွေဖည်မသွားကြောင်း ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။ ဤကိစ္စတွင် တန်းတူညီတူကွဲလွဲမှုဟု ယူဆချက်အား ချိုးဖောက်ခြင်းမဟုတ်ကြောင်း ကျွန်ုပ်တို့ပြောနိုင်သည် ။
ဆက်စပ်- Regression Analysis တွင် Heteroskedasticity ကို နားလည်ခြင်း။
Diagnostic trace #3- ပုံမှန် QQ ခြေရာကောက်
ဆုတ်ယုတ်မှုပုံစံမှ အကြွင်းအကျန်များကို ပုံမှန်အတိုင်း ဖြန့်ဝေခြင်းရှိမရှိ ဆုံးဖြတ်ရန် ဤကြံစည်မှုကို အသုံးပြုသည်။ ဤဂရပ်ပေါ်ရှိ အမှတ်များသည် ဖြောင့်ထောင့်ဖြတ်မျဉ်းတစ်လျှောက် ခန့်မှန်းခြေအားဖြင့် တည်ရှိနေပါက ကျန်ရှိသော အရာများကို ပုံမှန်အတိုင်း ဖြန့်ဝေသည်ဟု ကျွန်ုပ်တို့ ယူဆနိုင်ပါသည်။

ကျွန်ုပ်တို့၏ဥပမာတွင်၊ အမှတ်များသည် ထောင့်ဖြတ်မျဉ်းဖြောင့်တစ်လျှောက် အကြမ်းဖျင်းအားဖြင့် တည်ရှိနေသည်ကို တွေ့နိုင်ပါသည်။ #10 နှင့် #8 တို့သည် အဆုံးတွင် မျဉ်းကြောင်းမှ အနည်းငယ်သွေဖည်သွားသော်လည်း ကျန်အကြွင်းများကို ပုံမှန်ဖြန့်ဝေခြင်းမဟုတ်ကြောင်း ကြေညာရန် မလုံလောက်ပါ။
Diagnostic Plot နံပါတ် 4- အကြွင်းအကျန်များနှင့် ချိန်ညှိထားသော Plot
အကြွင်းအကျန်များသည် လိုင်းမဟုတ်သောပုံစံများကို ပြသခြင်းရှိမရှိ ဆုံးဖြတ်ရန် ဤကွက်ကွက်ကို အသုံးပြုသည်။ ကွက်လပ်၏ အလယ်ဗဟိုရှိ အနီရောင်မျဉ်းသည် ခန့်မှန်းခြေအားဖြင့် အလျားလိုက်ဖြစ်နေပါက၊ အကြွင်းအကျန်များသည် မျဉ်းကြောင်းပုံစံအတိုင်း လုပ်ဆောင်သည်ဟု ကျွန်ုပ်တို့ ယူဆနိုင်ပါသည်။

ကျွန်ုပ်တို့၏ဥပမာတွင်၊ အနီရောင်မျဉ်းသည် ပြီးပြည့်စုံသော အလျားလိုက်မျဉ်းမှ သွေဖည်သွားသည်ကို တွေ့နိုင်သော်လည်း သိသိသာသာ မရှိပါ။ အကြွင်းအကျန်များသည် အကြမ်းဖျင်းအားဖြင့် မျဉ်းနားပုံစံအတိုင်း လိုက်နာကြပြီး၊ မျဉ်းကြောင်းပြန်ဆုတ်မှုပုံစံသည် ဤဒေတာအတွဲအတွက် သင့်လျော်ကြောင်း ကျွန်ုပ်တို့ပြောနိုင်ဖွယ်ရှိပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
linear regression ၏ ယူဆချက်လေးခု
ကိန်းဂဏန်းစာရင်းဇယားတွင် ကျန်ရှိနေသော အရာများကား အဘယ်နည်း။
R တွင်ကျန်ရှိသောကွက်ကွက်ဖန်တီးနည်း
အတိုင်းအတာတစ်ခုနှင့် တည်နေရာကွက်ကွက်ကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံ