R ဖြင့် dfbetas တွက်နည်း


စာရင်းဇယားများတွင်၊ ဆုတ်ယုတ်မှုပုံစံများတွင် မတူညီသော လေ့လာတွေ့ရှိချက်များအပေါ် မည်ကဲ့သို့ လွှမ်းမိုးမှုရှိသည်ကို ကျွန်ုပ်တို့ မကြာခဏ သိချင်ကြသည်။

လေ့လာမှုများ၏ လွှမ်းမိုးမှုကို တွက်ချက်ရန် နည်းလမ်းတစ်ခုမှာ DFBETAS ဟု ခေါ်သော မက်ထရစ်ကို အသုံးပြုခြင်းဖြစ်ပြီး၊ တစ်ခုချင်းစီ၏ ရှုမြင်မှုတစ်ခုစီကို ဖယ်ရှားခြင်း၏ ကိန်းဂဏန်းတစ်ခုစီအပေါ် စံသတ်မှတ်ထားသော အကျိုးသက်ရောက်မှုကို ပြောပြသည်။

ဤမက်ထရစ်သည် ပေးထားသော ဆုတ်ယုတ်မှုပုံစံတစ်ခုတွင် ကိန်းဂဏန်းခန့်မှန်းချက်တစ်ခုစီအပေါ် စောင့်ကြည့်မှုတစ်ခုစီ၏ လွှမ်းမိုးမှုကို အကြံဉာဏ်ပေးသည်။

ဤသင်ခန်းစာတွင် R တွင် မော်ဒယ်တစ်ခုစီရှိ ကြည့်ရှုမှုတစ်ခုစီအတွက် DFBETAS တွက်ချက်ပုံနှင့် မြင်ယောင်ပုံအဆင့်ဆင့်ကို ဥပမာပြထားသည်။

အဆင့် 1- ဆုတ်ယုတ်မှုပုံစံတစ်ခုကို ဖန်တီးပါ။

ဦးစွာ၊ R တွင်တည်ဆောက်ထားသော mtcars ဒေတာအစုံကို အသုံးပြု၍ များစွာသောမျဉ်းကြောင်းဆုတ်ယုတ်မှုပုံစံ တစ်ခုကို ဖန်တီးပါမည်။

 #fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

အဆင့် 2- စောင့်ကြည့်မှုတစ်ခုစီအတွက် DFBETAS တွက်ချက်ပါ။

ထို့နောက်၊ ကျွန်ုပ်တို့သည် မော်ဒယ်ရှိကြည့်ရှုမှုတစ်ခုစီအတွက် DFBETAS တန်ဖိုးများကို တွက်ချက်ရန် Built-in dfbeta() လုပ်ဆောင်ချက်ကို အသုံးပြုပါမည်။

 #calculate DFBETAS for each observation in the model
dfbetas <- as . data . frame (dfbetas(model))

#display DFBETAS for each observation
dfbetas

                      (Intercept) disp hp
Mazda RX4 -0.1174171253 0.030760632 1.748143e-02
Mazda RX4 Wag -0.1174171253 0.030760632 1.748143e-02
Datsun 710 -0.1694989349 0.086630144 -3.332781e-05
Hornet 4 Drive 0.0577309674 0.078971334 -8.705488e-02
Hornet Sportabout -0.0204333878 0.237526523 -1.366155e-01
Valiant -0.1711908285 -0.139135639 1.829038e-01
Duster 360 -0.0312338677 -0.005356209 3.581378e-02
Merc 240D -0.0312259577 -0.010409922 2.433256e-02
Merc 230 -0.0865872595 0.016428917 2.287867e-02
Merc 280 -0.1560683502 0.078667906 -1.911180e-02
Merc 280C -0.2254489597 0.113639937 -2.760800e-02
Merc 450SE 0.0022844093 0.002966155 -2.855985e-02
Merc 450SL 0.0009062022 0.001176644 -1.132941e-02
Merc 450SLC 0.0041566755 0.005397169 -5.196706e-02
Cadillac Fleetwood 0.0388832216 -0.134511133 7.277283e-02
Lincoln Continental 0.0483781688 -0.121146607 5.326220e-02
Chrysler Imperial -0.1645266331 0.236634429 -3.917771e-02
Fiat 128 0.5720358325 -0.181104179 -1.265475e-01
Honda Civic 0.3490872162 -0.053660545 -1.326422e-01
Toyota Corolla 0.7367058819 -0.268512348 -1.342384e-01
Toyota Corona -0.2181110386 0.101336902 5.945352e-03
Dodge Challenger -0.0270169005 -0.123610713 9.441241e-02
AMC Javelin -0.0406785103 -0.141711468 1.074514e-01
Camaro Z28 0.0390139262 0.012846225 -5.031588e-02
Pontiac Firebird -0.0549059340 0.574544346 -3.689584e-01
Fiat X1-9 0.0565157245 -0.017751582 -1.262221e-02
Porsche 914-2 0.0839169111 -0.028670987 -1.240452e-02
Lotus Europa 0.3444562478 -0.402678927 2.135224e-01
Ford Pantera L -0.1598854695 -0.094184733 2.320845e-01
Ferrari Dino -0.0343997122 0.248642444 -2.344154e-01
Maserati Bora -0.3436265545 -0.511285637 7.319066e-01
Volvo 142E -0.1784974091 0.132692956 -4.433915e-02

စူးစမ်းမှုတစ်ခုစီအတွက်၊ မူလအစီအစဥ်အတွက် coefficient ခန့်မှန်းချက်၊ disp variable နှင့် hp variable တို့ကို ဖယ်ရှားသည့်အခါတွင် ဖြစ်ပေါ်သည့် hp variable တို့ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

ယေဘုယျအားဖြင့်၊ n သည် စူးစမ်းမှုအရေအတွက်ဖြစ်သည့် 2/√ n ၏ DBETAS တန်ဖိုးထက် ကျော်လွန်ပါက ပေးထားသော coefficient ၏ ခန့်မှန်းချက်အပေါ် ပြင်းထန်သော သြဇာလွှမ်းမိုးမှုရှိသည်ဟု ကျွန်ုပ်တို့ယူဆပါသည်။

ဤဥပမာတွင်၊ တံခါးခုံသည် 0.3535534 ဖြစ်လိမ့်မည်။

 #find number of observations
n <- nrow (mtcars)

#calculate DFBETAS threshold value
thresh <- 2/ sqrt (n)

thresh

[1] 0.3535534

အဆင့် 3- DFBETAS ကို မြင်ယောင်ကြည့်ပါ။

နောက်ဆုံးတွင်၊ လေ့လာမှုတစ်ခုစီအတွက် DFBETAS တန်ဖိုးကို မြင်သာစေရန် ကွက်ကွက်များကို ဖန်တီးနိုင်သည်-

 #specify 2 rows and 1 column in plotting region
by(mfrow=c(2,1))

#plot DFBETAS for disp with threshold lines
plot(dfbetas$disp, type=' h ')
abline(h = thresh, lty = 2)
abline(h = -thresh, lty = 2)

#plot DFBETAS for hp with threshold lines 
plot(dfbetas$hp, type=' h ')
abline(h = thresh, lty = 2)
abline(h = -thresh, lty = 2)

R တွင် DFBETAS

ကွက်ကွက်တစ်ခုစီတွင်၊ x-axis သည် dataset ရှိ မှတ်သားမှုတစ်ခုစီ၏ အညွှန်းကိုပြသပြီး y-value သည် စူးစမ်းမှုတစ်ခုစီနှင့် ခန့်မှန်းချက်တစ်ခုစီအတွက် သက်ဆိုင်သော DFBETAS ကိုပြသသည်။

ပထမကွက်တွင် ရှုမြင်ချက်သုံးခုသည် ပကတိအဆင့်သတ်မှတ်ချက်တန်ဖိုး 0.3535534 ထက်ကျော်လွန်နေသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပြီး ဒုတိယကွက်တွင် ရှုမြင်ချက်နှစ်ခုသည် ပကတိအဆင့်သတ်မှတ်တန်ဖိုးထက် ကျော်လွန်နေသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်ပါသည်။

စံနမူနာဖော်ကိန်းများ ခန့်မှန်းချက်အပေါ် မလျော်ကန်သော သြဇာလွှမ်းမိုးမှုရှိမရှိ ဆုံးဖြတ်ရန် ဤလေ့လာတွေ့ရှိချက်များကို ပိုမိုနီးကပ်စွာ လေ့လာရန် ကျွန်ုပ်တို့ ရွေးချယ်နိုင်ပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R တွင် ရိုးရှင်းသော linear regression လုပ်နည်း
R တွင် linear regression အများအပြားလုပ်ဆောင်နည်း
R တွင် leverage ကိန်းဂဏန်းများကို တွက်ချက်နည်း
R ဖြင့် DFFITS တွက်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်