ကွဲလွဲမှုက ဘာကိုရှင်းပြတာလဲ။ (အဓိပ္ပါယ် & #038; ဥပမာ)


ရှင်းပြထားသော ကွဲလွဲမှု (တစ်ခါတစ်ရံ “ ရှင်းပြထားသော ကွဲလွဲမှု” ဟုခေါ်သည်) သည် မော်ဒယ်၏ ခန့်မှန်းပေးသူ ကိန်းရှင်(များ) ဖြင့် ရှင်းပြနိုင်သည့် မော်ဒယ်ရှိ တုံ့ပြန်မှုကိန်းရှင်၏ ကွဲလွဲမှုကို ရည်ညွှန်းပါသည်။

မော်ဒယ်တစ်ခု၏ ရှင်းလင်းချက်ကွဲလွဲမှု မြင့်မားလေ၊ မော်ဒယ်က ရှင်းပြနိုင်သည့် အချက်အလက် ကွဲလွဲလေလေဖြစ်သည်။

ရှင်းပြထားသော ကွဲလွဲမှုသည် မတူညီသော ကိန်းဂဏန်းစံနမူနာနှစ်ခု၏ ရလဒ်များတွင် ပေါ်လာသည်-

1. ANOVA: အမှီအခိုကင်းသော အုပ်စုသုံးစု သို့မဟုတ် ထို့ထက်ပိုသော အဓိပ္ပါယ်များကို နှိုင်းယှဉ်ရန် အသုံးပြုသည်။

2. Regression- တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော ကြိုတင်ခန့်မှန်းကိန်းရှင်များနှင့် တုံ့ပြန်မှုကိန်းရှင်ကြား ဆက်နွယ်မှုကို အရေအတွက်သတ်မှတ်ရန် အသုံးပြုသည်။

အောက်ပါနမူနာများသည် ဤနည်းလမ်းတစ်ခုစီတွင် ကျန်ရှိသောကွဲလွဲမှုကို အဓိပ္ပာယ်ဖွင့်ဆိုပုံကို ပြသထားသည်။

မှတ်ချက် – ရှင်းပြထားသော ကွဲလွဲမှု၏ ဆန့်ကျင်ဘက်အား residual variance ဟုခေါ်သည်။

ANOVA မော်ဒယ်များတွင် ကွဲပြားမှုကို ရှင်းပြထားသည်။

ကျွန်ုပ်တို့သည် ANOVA (“ ကွဲလွဲမှုကို ခွဲခြမ်းစိတ်ဖြာခြင်း” ) မော်ဒယ်နှင့် အံဝင်ခွင်ကျတိုင်း၊ ကျွန်ုပ်တို့သည် အောက်ပါပုံသဏ္ဍာန်ရှိသော ANOVA ဇယားကို အဆုံးသတ်လိုက်သည်-

အုပ်စုကွဲကွဲပြားမှု အတွက် ရှင်းပြထားသော ကွဲလွဲမှုကို SS (“ စတုရန်းများ” ) ကော်လံတွင် တွေ့နိုင်သည်။

အထက်ဖော်ပြပါ ANOVA မော်ဒယ်တွင်၊ ရှင်းပြထားသော ကွဲလွဲမှုမှာ 192.2 ဖြစ်ကြောင်း တွေ့ရပါသည်။

ဤရှင်းပြထားသောကွဲလွဲမှုသည် “ မြင့်မားသည်” ကိုဆုံးဖြတ်ရန်၊ အုပ်စုများအတွင်းအတွက် ပျမ်းမျှစတုရန်းနှစ်ခုနှင့် အုပ်စုများကြားအတွက် ပျမ်းမျှနှစ်ထပ်ကိန်းများကို တွက်ချက်နိုင်ပြီး ANOVA ဇယားရှိ အလုံးစုံ F တန်ဖိုးကိုပေးသည့် နှစ်ခုကြားအချိုးကို ရှာဖွေနိုင်သည်။

  • F = MS enters /MS in
  • F = 96.1 / 40.76296
  • F = 2.357

အထက်ပါ ANOVA ဇယားရှိ F တန်ဖိုးသည် 2.357 ဖြစ်ပြီး သက်ဆိုင်ရာ p တန်ဖိုးမှာ 0.113848 ဖြစ်သည်။

ဤ p-value သည် α = 0.05 ထက်မနည်းသောကြောင့် ANOVA ၏ null hypothesis ကို ငြင်းပယ်ရန် လုံလောက်သောအထောက်အထားမရှိပါ။

ဆိုလိုသည်မှာ ကျွန်ုပ်တို့ နှိုင်းယှဉ်နေသော အုပ်စုများကြား ပျမ်းမျှ ကွာခြားချက်မှာ သိသိသာသာ ကွာခြားသည်ဟု ဆိုရန် လုံလောက်သော သက်သေ မရှိပါ။

ANOVA မော်ဒယ်တွင် ရှင်းပြထားသော ကွဲလွဲမှုသည် ရှင်းပြမထားသော ကွဲလွဲမှုနှင့် နှိုင်းယှဉ်ပါက သေးငယ်ကြောင်း ၎င်းက ကျွန်ုပ်တို့အား ပြောပြသည်။

ကွဲပြားမှုကို ဆုတ်ယုတ်မှုပုံစံများတွင် ရှင်းပြထားသည်။

ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင်၊ ရှင်းပြထားသောကွဲလွဲမှုကို R-squared အဖြစ် အကျဉ်းချုပ်ပြီး မကြာခဏ R2 ဟုရေးသည်။

ဤတန်ဖိုးသည် မော်ဒယ်ရှိ ကြိုတင်ခန့်မှန်းကိန်းရှင်(များ) မှ ရှင်းပြနိုင်သည့် တုံ့ပြန်မှုကိန်းရှင်၏ ကွဲလွဲမှုအချိုးအစားကို ကိုယ်စားပြုသည်။

R နှစ်ထပ်ကိန်း၏တန်ဖိုးသည် 0 မှ နေရာတွင် ရှိနိုင်သည်-

  • 0 ၏တန်ဖိုးသည် တုံ့ပြန်မှုကိန်းရှင်အား ခန့်မှန်းသူကိန်းရှင်(များ) က လုံးဝရှင်းပြမရနိုင်ကြောင်း ညွှန်ပြသည်။
  • 1 ၏တန်ဖိုးသည် တုံ့ပြန်မှုကိန်းရှင်အား ကြိုတင်ခန့်မှန်းကိန်းရှင်(များ) မှ အမှားအယွင်းမရှိဘဲ စုံလင်စွာရှင်းပြနိုင်သည်ကို ညွှန်ပြသည်။

ကျွန်ုပ်တို့သည် ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို အံဝင်ခွင်ကျသောအခါတွင်၊ ကျွန်ုပ်တို့သည် များသောအားဖြင့် အောက်ပါအတိုင်း ရလဒ်ကို ရရှိသည်-

ရှင်းပြထားသောကွဲလွဲမှုသည် 168.5976 ဖြစ်ပြီး စုစုပေါင်းကွဲလွဲမှုသည် 174.5 ဖြစ်ကြောင်း ကျွန်ုပ်တို့တွေ့နိုင်ပါသည်။

ဤတန်ဖိုးများကို အသုံးပြု၍ ဤဆုတ်ယုတ်မှုပုံစံအတွက် R-squared တန်ဖိုးကို အောက်ပါအတိုင်း တွက်ချက်နိုင်ပါသည်။

  • R နှစ်ထပ်ကိန်း- Regression SS / Total SS
  • R နှစ်ထပ်ကိန်း- 168.5976 / 174.5
  • R နှစ်ထပ်ကိန်း- 0.966

ဤမော်ဒယ်၏ R-squared တန်ဖိုးသည် 1 နှင့် နီးစပ်သောကြောင့်၊ ၎င်းသည် မော်ဒယ်တွင် ရှင်းပြထားသော ကွဲလွဲမှုသည် အလွန်မြင့်မားကြောင်း ကျွန်ုပ်တို့ကို ပြောပြသည်။

တစ်နည်းဆိုရသော်၊ မော်ဒယ်သည် တုံ့ပြန်မှုကိန်းရှင်၏ ကွဲလွဲမှုကို ရှင်းပြရန် ခန့်မှန်းသူကိန်းရှင်များကို အသုံးပြု၍ ကောင်းမွန်စွာလုပ်ဆောင်နိုင်သည် ။

ဆက်စပ်မှု- ကောင်းသော R-squared တန်ဖိုးဆိုသည်မှာ အဘယ်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်