R တွင် goldfeld-quandt စမ်းသပ်နည်း


Goldfeld-Quandt စမ်းသပ်မှု သည် ဆုတ်ယုတ်မှုပုံစံတွင် heteroskedasticity ရှိမရှိ ဆုံးဖြတ်ရန် အသုံးပြုသည်။

Heteroskedasticity သည် ဆုတ်ယုတ်မှု ပုံစံတစ်ခုရှိ တုံ့ပြန်မှု ပုံစံတစ်ခု၏ မတူညီသောအဆင့်များတွင် အကြွင်းအကျန်များ မညီမညာ ပျံ့နှံ့သွားခြင်းကို ရည်ညွှန်းသည်။

heteroscedasticity ရှိနေပါက၊ ၎င်းသည် အကြွင်းအကျန်များကို တုံ့ပြန်မှုကိန်းရှင်အဆင့်တစ်ခုစီတွင် အညီအမျှ ခွဲဝေပေးထားကြောင်း linear regression ၏ အဓိကယူဆချက် တစ်ခုကို ချိုးဖောက်ပါသည်။

ဤသင်ခန်းစာသည် ပေးထားသော ဆုတ်ယုတ်မှုပုံစံတွင် မျိုးရိုးလိုက်ခြင်းရှိ/မရှိကို ဆုံးဖြတ်ရန် R တွင် Goldfeld-Quandt စမ်းသပ်နည်းကို လုပ်ဆောင်ပုံအဆင့်ဆင့် ဥပမာကို ပေးပါသည်။

အဆင့် 1- ဆုတ်ယုတ်မှုပုံစံကို ဖန်တီးပါ။

ပထမဦးစွာ၊ R တွင်တည်ဆောက်ထားသော mtcars dataset ကိုအသုံးပြု၍ Multiple linear regression model ကို ဖန်တီးပါမည်။

 #fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

အဆင့် 2: Goldfeld-Quandt စမ်းသပ်မှုကို လုပ်ဆောင်ပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် Goldfeld-Quandt စမ်းသပ်မှုလုပ်ဆောင်ရန် lmtest ပက်ကေ့ချ်မှ gqtest() လုပ်ဆောင်ချက်ကို အသုံးပြုပြီး မျိုးရိုးလိုက်ခြင်းရှိမရှိ ဆုံးဖြတ်ရန်။

ဤလုပ်ဆောင်ချက်သည် အောက်ပါ syntax ကိုအသုံးပြုသည်-

gqtest(မော်ဒယ်၊ အမှာစာ၊ ဒေတာ၊ အပိုင်းအစ)

ရွှေ-

  • မော်ဒယ်- lm() command ဖြင့် ဖန်တီးထားသော linear regression model။
  • order.by- မော်ဒယ်၏ ကြိုတင်ခန့်မှန်းနိုင်သော ကိန်းရှင်(များ)။
  • data- ဒေတာအတွဲအမည်။
  • အပိုင်းခွဲ*- ဒေတာအတွဲမှ ဖယ်ရှားရန် ဗဟိုလေ့လာချက် အရေအတွက်။

*Goldfeld-Quandt စမ်းသပ်မှုသည် ဒေတာအစု၏ အလယ်ဗဟိုတွင်ရှိသော စူးစမ်းလေ့လာမှုအများအပြားကို ဖယ်ရှားပြီးနောက် ကျန်ရှိသော ဖြန့်ကျက်မှုသည် ဒေတာအစုံ၏တစ်ဖက်တစ်ချက်တွင်ရှိသော ရလဒ်ဒေတာအတွဲနှစ်ခုနှင့် ကွဲပြားမှုရှိမရှိ စစ်ဆေးခြင်းတို့ဖြင့် လုပ်ဆောင်သည်။ ဗဟိုလေ့လာတွေ့ရှိချက်။

ပုံမှန်အားဖြင့်၊ ကျွန်ုပ်တို့သည် စုစုပေါင်းလေ့လာတွေ့ရှိချက်များ၏ 20% ခန့်ကို ဖယ်ရှားရန် ရွေးချယ်သည်။ ဤကိစ္စတွင်၊ mtcars တွင်စုစုပေါင်းလေ့လာတွေ့ရှိချက် 32 ခုရှိသည်၊ ထို့ကြောင့်ကျွန်ုပ်တို့သည်ဗဟိုကြည့်ရှုမှု 7 ခုကိုဖယ်ရှားရန်ရွေးချယ်နိုင်သည်။

 #load lmtest library
library(lmtest)

#perform the Goldfeld Quandt test
gqtest(model, order.by = ~disp+hp, data = mtcars, fraction = 7)

	Goldfeld-Quandt test

data: model
GQ = 1.0316, df1 = 10, df2 = 9, p-value = 0.486
alternative hypothesis: variance increases from segment 1 to 2

ဤသည်မှာ ရလဒ်ကို မည်သို့အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်-

  • စမ်းသပ်မှုစာရင်းအင်းသည် 1.0316 ဖြစ်သည်။
  • သက်ဆိုင်ရာ p-တန်ဖိုးသည် 0.486 ဖြစ်သည်။

Goldfeld-Quandt စမ်းသပ်မှုတွင် အောက်ပါ null နှင့် အခြားအခြားသော အယူအဆများကို အသုံးပြုသည် ။

  • Null (H 0 ) : Homoskedasticity ရှိနေသည်။
  • အစားထိုး ( HA ): Heteroskedasticity ရှိနေပါသည်။

p-value သည် 0.05 ထက်မနည်းသောကြောင့်၊ null hypothesis ကို ငြင်းပယ်ရန် ပျက်ကွက်ပါသည်။ ဆုတ်ယုတ်မှုပုံစံတွင် heteroskedasticity ရှိနေသည်ဟု ဆိုရန် လုံလောက်သော အထောက်အထား မရှိပါ။

ဘာဆက်လုပ်ရမလဲ

Goldfeld-Quandt စမ်းသပ်မှု၏ null hypothesis ကို သင် ငြင်းဆိုရန် ပျက်ကွက်ပါက၊ heteroskedasticity သည် ရှိမနေဘဲ မူလဆုတ်ယုတ်မှု၏ ရလဒ်ကို ဆက်လက်အနက်ဖွင့်နိုင်သည်။

သို့သော်၊ သင်သည် null hypothesis ကို ငြင်းပယ်ပါက၊ heteroskedasticity သည် data တွင် ရှိနေသည်ဟု ဆိုလိုသည်။ ဤကိစ္စတွင်၊ regression output table တွင်ပြသထားသော standard errors များသည် စိတ်ချရမည်မဟုတ်ပါ။

ဤပြဿနာကို ဖြေရှင်းရန် ဘုံနည်းလမ်းများစွာ အပါအဝင်၊

1. တုံ့ပြန်မှုကိန်းရှင်ကို ပြောင်းလဲပါ။

ဥပမာအားဖြင့် တုံ့ပြန်မှုကိန်းရှင်တွင် အသွင်ပြောင်းခြင်းကို လုပ်ဆောင်နိုင်သည်၊ ဥပမာအားဖြင့် တုံ့ပြန်မှုကိန်းရှင် ၏ မှတ်တမ်း၊ စတုရန်းရတ် သို့မဟုတ် ကုဗတုံးအမြစ်ကို ယူဆောင်သွားနိုင်သည်။ ယေဘူယျအားဖြင့်၊ ၎င်းသည် မျိုးရိုးလိုက်ခြင်းကို ပျောက်စေနိုင်သည်။

2. အလေးချိန် ဆုတ်ယုတ်မှုကို သုံးပါ။

Weighted regression သည် ၎င်း၏ တပ်ဆင်ထားသော တန်ဖိုး၏ ကွဲလွဲမှုကို အခြေခံ၍ ဒေတာအမှတ်တစ်ခုစီသို့ အလေးချိန်ကို သတ်မှတ်ပေးသည်။ အခြေခံအားဖြင့်၊ ၎င်းသည် ၎င်းတို့ကျန်ရှိသော စတုရန်းများကို လျှော့ချပြီး ပိုမိုကွဲပြားမှုများရှိသည့် ဒေတာအမှတ်များကို နိမ့်စေပါသည်။

သင့်လျော်သောအလေးများကိုအသုံးပြုသောအခါ၊ အလေးချိန်ပြန်ဆုတ်ခြင်းသည် မျိုးရိုးလိုက်ခြင်းပြဿနာကို ဖယ်ရှားပေးနိုင်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် White ၏စမ်းသပ်မှုပြုလုပ်နည်း
R တွင် Breusch-Pagan စမ်းသပ်မှုပြုလုပ်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်