Regression ၏ standard error ကို နားလည်ခြင်း။
ဆုတ်ယုတ်မှုပုံစံကို ဒေတာအစုတစ်ခုနှင့် အံဝင်ခွင်ကျဖြစ်စေသောအခါ၊ ဆုတ်ယုတ်မှုပုံစံသည် ဒေတာအစုံနှင့် မည်မျှ အံဝင်ခွင်ကျဖြစ်သည်ကို ကျွန်ုပ်တို့ စိတ်ဝင်စားလေ့ရှိပါသည်။ အံဝင်ခွင်ကျကောင်းမှုကို တိုင်းတာရန်အတွက် အသုံးများသော မက်ထရစ်နှစ်ခုတွင် R နှစ်ထပ်ကိန်း ( R2 ) နှင့် ဆုတ်ယုတ်ခြင်း၏ စံအမှား ၊ မကြာခဏဆိုသလို S ကို ရည်ညွှန်းသည်။
ဤသင်ခန်းစာသည် ဆုတ်ယုတ်မှု (S) ၏ စံလွဲချော်မှု (S) ၏ စံလွဲချော်မှုကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည့်အပြင် R 2 ထက် ပိုမိုအသုံးဝင်သော အချက်အလက်ကို အဘယ်ကြောင့် ပေးနိုင်ကြောင်း ရှင်းပြထားသည်။
ဆုတ်ယုတ်မှုတွင် R-squared နှင့် စံအမှား
အရေးကြီးသော စာမေးပွဲတစ်ခုနှင့် ၎င်းတို့၏ စာမေးပွဲရမှတ်တို့ကို ဖြေဆိုရန် တစ်လလျှင် ကျောင်းသား ၁၂ ဦး တစ်နေ့လျှင် နာရီမည်မျှ လေ့လာခဲ့သည်ကို ပြသသည့် ရိုးရှင်းသောဒေတာအတွဲတစ်ခုရှိသည်ဆိုပါစို့။
Excel တွင် ဤဒေတာအတွဲနှင့် ရိုးရှင်းသော မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို ကိုက်ညီပါက၊ ကျွန်ုပ်တို့သည် အောက်ပါရလဒ်ကို ရရှိသည်-
R နှစ်ထပ်ကိန်း သည် ခန့်မှန်းသူကိန်းရှင်ဖြင့် ရှင်းပြနိုင်သော တုံ့ပြန်မှုကိန်းရှင်၏ ကွဲလွဲမှုအချိုးအစားဖြစ်သည်။ ဤကိစ္စတွင်၊ စာမေးပွဲရမှတ်များတွင် ကွဲလွဲမှု၏ 65.76% ကို စာသင်ချိန်နာရီပေါင်းများစွာဖြင့် ရှင်းပြနိုင်သည်။
ဆုတ်ယုတ်မှု၏စံအမှား သည် သတိပြုမိသောတန်ဖိုးများနှင့် ဆုတ်ယုတ်မှုမျဉ်းကြားရှိ ပျမ်းမျှအကွာအဝေးဖြစ်သည်။ ဤကိစ္စတွင်၊ လေ့လာထားသောတန်ဖိုးများသည် ဆုတ်ယုတ်မှုမျဉ်းမှ ပျမ်းမျှယူနစ် 4.89 ဖြင့် သွေဖည်သွားပါသည်။
ကျွန်ုပ်တို့သည် အမှန်တကယ် ဒေတာအမှတ်များကို ဆုတ်ယုတ်မှုမျဉ်းဖြင့် ရေးဆွဲပါက၊ ၎င်းကို ကျွန်ုပ်တို့ ပိုမိုရှင်းလင်းစွာ မြင်နိုင်သည်-
အချို့သော လေ့လာတွေ့ရှိချက်များသည် ဆုတ်ယုတ်မှုမျဉ်းနှင့် အလွန်နီးကပ်စွာ တည်ရှိနေသော်လည်း အခြားအရာများ မပါရှိကြောင်း သတိပြုပါ။ သို့သော် ပျမ်းမျှအားဖြင့်၊ လေ့လာထားသောတန်ဖိုးများသည် ဆုတ်ယုတ်မှုမျဉ်းမှ 4.19 ယူနစ် ဖြင့် သွေဖည်သွားပါသည်။
ကြိုတင်ခန့်မှန်းချက်များ၏ တိကျမှုကို အကဲဖြတ်ရန် အသုံးပြုနိုင်သောကြောင့် ဆုတ်ယုတ်မှု၏ စံအမှားသည် အထူးအသုံးဝင်ပါသည်။ ခန့်မှန်းခြေ 95% သည် ဆုတ်ယုတ်မှု၏ စံလွဲချော်မှု နှစ်ခုအတွင်း ကျရောက်သင့်ပြီး 95% ခန့်မှန်းချက်ကြားကာလ၏ လျင်မြန်သော ခန့်မှန်းချက်ဖြစ်သည့်
ဆုတ်ယုတ်မှုပုံစံကို အသုံးပြု၍ ခန့်မှန်းမှုများ ပြုလုပ်လိုပါက၊ ဆုတ်ယုတ်မှု၏ စံအမှားသည် R-squared ထက် သိရန် ပိုမိုအသုံးဝင်သော တိုင်းတာမှုတစ်ခု ဖြစ်နိုင်သည်။
ဆုတ်ယုတ်မှု၏ စံအမှားသည် မော်ဒယ်တစ်ခု၏ “ အံကိုက်” ကို အကဲဖြတ်ရန်အတွက် ပိုမိုအသုံးဝင်သည့် တိုင်းတာမှုတစ်ခုဖြစ်နိုင်သည်ကို ဥပမာပြရန်၊ အရေးကြီးသော စာမေးပွဲတစ်ခုမတိုင်မီ တစ်လလျှင် ကျောင်းသား 12 နာရီ မည်မျှလေ့လာခဲ့သည်ကို ပြသသည့် အခြားသော ဥပမာတစ်ခုအား သုံးသပ်ကြည့်ကြပါစို့။ သူတို့ရဲ့ စာမေးပွဲရလဒ်
s-values များအားလုံးကို ထက်ဝက်ခွဲထားသည် မှလွဲ၍ ၎င်းသည် ယခင်ကဲ့သို့ အတိအကျတူညီသော ဒေတာအစုဖြစ်ကြောင်း သတိပြုပါ ။ ထို့ကြောင့် ဤဒေတာအတွဲရှိ ကျောင်းသားများသည် ယခင်ဒေတာအတွဲရှိ ကျောင်းသားများကဲ့သို့ အချိန်တစ်ဝက်တိတိ လေ့လာခဲ့ပြီး စာမေးပွဲအဆင့် တစ်ဝက်တိတိ ရရှိခဲ့သည်။
Excel တွင် ဤဒေတာအတွဲနှင့် ရိုးရှင်းသော မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို ကိုက်ညီပါက၊ ကျွန်ုပ်တို့သည် အောက်ပါရလဒ်ကို ရရှိသည်-
65.76% ၏ R နှစ်ထပ်ကိန်းသည် ယခင်ဥပမာတွင်ကဲ့သို့ အတိအကျတူညီကြောင်း သတိပြုပါ။
သို့သော်၊ ဆုတ်ယုတ်မှု၏စံအမှားမှာ 2.095 ဖြစ်ပြီး၊ ၎င်းသည် ယခင်ဥပမာရှိ ဆုတ်ယုတ်မှု၏စံအမှားထက်ဝက်တိတိဖြစ်သည်။
ကျွန်ုပ်တို့သည် အမှန်တကယ် ဒေတာအမှတ်များကို ဆုတ်ယုတ်မှုမျဉ်းဖြင့် ရေးဆွဲပါက၊ ၎င်းကို ကျွန်ုပ်တို့ ပိုမိုရှင်းလင်းစွာ မြင်နိုင်သည်-
ဆုတ်ယုတ်မှုမျဉ်းတစ်ဝိုက်တွင် စူးစမ်းလေ့လာမှုများကို ပိုမိုနီးကပ်စွာ အစုလိုက်အပြုံလိုက် မည်ကဲ့သို့ အစုလိုက်အပြုံလိုက်ပြုလုပ်သည်ကို သတိပြုပါ။ ပျမ်းမျှအားဖြင့်၊ လေ့လာတွေ့ရှိထားသောတန်ဖိုးများသည် ဆုတ်ယုတ်မှုမျဉ်းမှ ယူနစ် 2,095 တွင်တည်ရှိသည်။
ထို့ကြောင့် regression model နှစ်ခုစလုံးတွင် R-squared 65.76% ရှိသော်လည်း၊ ဒုတိယမော်ဒယ်သည် နိမ့်သော regression standard error ရှိသောကြောင့် ပိုမိုတိကျသော ခန့်မှန်းချက်များကို ပေးစွမ်းနိုင်သည်ကို ကျွန်ုပ်တို့သိပါသည်။
Standard Error ကိုအသုံးပြုခြင်း၏အကျိုးကျေးဇူးများ
ဆုတ်ယုတ်မှု (S) ၏ စံအမှားသည် မော်ဒယ်၏ R စတုရန်းထက် သိရန် ပို၍အသုံးဝင်သည် ကြိုတင်ခန့်မှန်းမှုများပြုလုပ်ရန် ဆုတ်ယုတ်မှုပုံစံကို ကျွန်ုပ်တို့အသုံးပြုလိုပါက၊ S သည် ခန့်မှန်းခြင်းရည်ရွယ်ချက်အတွက် အသုံးပြုရန် မော်ဒယ်တစ်ခုသည် တိကျမှန်ကန်မှုရှိမရှိ ကျွန်ုပ်တို့ကို အလွန်လွယ်ကူစွာ ပြောပြနိုင်ပါသည်။
ဥပမာအားဖြင့်၊ ကျွန်ုပ်တို့သည် အမှန်တကယ်ရမှတ်၏ 6 မှတ်အတွင်း စာမေးပွဲရမှတ်များကို ခန့်မှန်းနိုင်သည့် 95% ခန့်မှန်းကြားကာလတစ်ခုကို ထုတ်လုပ်လိုသည်ဆိုပါစို့။
ကျွန်ုပ်တို့၏ပထမမော်ဒယ်တွင် R-squared 65.76% ရှိသည်၊ သို့သော် ၎င်းသည် ကျွန်ုပ်တို့၏ခန့်မှန်းချက်ကြားကာလ၏ တိကျမှုနှင့်ပတ်သက်၍ ကျွန်ုပ်တို့အား ဘာမှမပြောပါ။ ကံကောင်းထောက်မစွာ၊ ပထမမော်ဒယ်တွင် S သည် 4.19 ပါရှိကြောင်းကိုလည်း ကျွန်ုပ်တို့သိပါသည်။ ဆိုလိုသည်မှာ 95% ခန့်မှန်းသည့်ကြားကာလသည် ခန့်မှန်းခြေအားဖြင့် 2*4.19 = +/- 8.38 ယူနစ် ကျယ်မည်ဖြစ်ပြီး၊ ၎င်းသည် ကျွန်ုပ်တို့၏ ခန့်မှန်းချက်ကြားကာလအတွက် အလွန်ကျယ်ပြန့်ပါသည်။
ကျွန်ုပ်တို့၏ဒုတိယမော်ဒယ်တွင် R-squared 65.76% လည်းရှိသော်လည်း၊ ၎င်းသည် ကျွန်ုပ်တို့၏ဟောကိန်းထုတ်သည့်ကြားကာလ၏တိကျမှုနှင့်ပတ်သက်၍ ကျွန်ုပ်တို့ကိုဘာမှမပြောပြပါ။ သို့သော်၊ ဒုတိယမော်ဒယ်တွင် S သည် 2.095 ရှိကြောင်း ကျွန်ုပ်တို့သိသည်။ ဆိုလိုသည်မှာ 95% ခန့်မှန်းသည့်ကြားကာလသည် ခန့်မှန်းခြေအားဖြင့် 2*2.095 = +/- 4.19 ယူနစ်ထက် ကျယ်မည်ဖြစ်ပြီး၊ ၎င်းမှာ 6 ထက်နည်းသောကြောင့် ခန့်မှန်းသည့်ကြားကာလများကို ထုတ်လုပ်ရန်အတွက် အသုံးပြုရလောက်အောင် တိကျပါသည်။
နောက်ထပ်ဖတ်ရန်
Simple Linear Regression နိဒါန်း
ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။