R တွင် box-cox အသွင်ပြောင်းနည်း (ဥပမာများနှင့်အတူ)

အားဖြင့် Benjamin Anderson ဇူလိုင် 27, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

box-cox အသွင်ပြောင်းခြင်းသည် ပုံမှန်မဟုတ်သော ဖြန့်ဝေထားသောဒေတာအစုံကို ပိုမို သာမာန်ဖြန့်ဝေမှု အစုအဖြစ်သို့ ပြောင်းလဲရန်အတွက် အသုံးများသောနည်းလမ်းဖြစ်သည်။

ဤနည်းလမ်း၏နောက်ကွယ်တွင် အခြေခံအယူအဆမှာ အောက်ပါဖော်မြူလာကို အသုံးပြု၍ ပြောင်းလဲထားသောဒေတာသည် ပုံမှန်ဖြန့်ဝေမှုအတိုင်း ဖြစ်နိုင်ချေနီးစပ်သည့် λ တန်ဖိုးတစ်ခုကို ရှာဖွေရန်ဖြစ်သည်-

y(λ) = (y ^λ – 1) / λ ဆိုလျှင် y ≠ 0
y(λ) = log(y) ဆိုရင် y = 0

MASS() စာကြည့်တိုက်မှ boxcox() လုပ်ဆောင်ချက်ကို အသုံးပြု၍ R တွင် box-cox အသွင်ပြောင်းခြင်းကို လုပ်ဆောင်နိုင်သည်။ အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

Box-Cox အသွင်ပြောင်းမှု ဖွံ့ဖြိုးတိုးတက်မှု၏ ကောင်းမွန်သော အကျဉ်းချုပ်အတွက် Connecticut တက္ကသိုလ်မှ ဤဆောင်းပါးကို ကိုးကားပါ။

ဥပမာ- R in Box-Cox အသွင်ပြောင်းခြင်း

အောက်ပါကုဒ်သည် ဒေတာအတွဲတစ်ခုနှင့် မျဉ်းဖြောင့်ဆုတ်ယုတ်မှုပုံစံကို မည်ကဲ့သို့ အံဝင်ခွင်ကျလုပ်ရမည်ကို ပြသသည်၊ ထို့နောက် တုံ့ပြန်မှုကိန်းရှင်ကို ပြောင်းလဲပြီး မော်ဒယ်အသစ်နှင့် အံဝင်ခွင်ကျဖြစ်စေရန် အကောင်းဆုံးသော lambda တစ်ခုကို ရှာဖွေရန် boxcox() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ။

 library (MASS)

#create data
y=c(1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 6, 7, 8)
x=c(7, 7, 8, 3, 2, 4, 4, 6, 6, 7, 5, 3, 3, 5, 8)

#fit linear regression model
model <- lm(y~x)

#find optimal lambda for Box-Cox transformation 
bc <- boxcox(y ~ x)
(lambda <- bc$x[which.max(bc$y)])

[1] -0.4242424

#fit new linear regression model using the Box-Cox transformation
new_model <- lm(((y^lambda-1)/lambda) ~ x)

အကောင်းဆုံး lambda သည် -0.4242424 ဖြစ်သွားသည်။ ထို့ကြောင့်၊ ဆုတ်ယုတ်မှုပုံစံအသစ်သည် မူလတုံ့ပြန်မှုကိန်းရှင် y ကို ကိန်းရှင် y = (y ^-0.4242424 – 1) / -0.4242424 ဖြင့် အစားထိုးခဲ့သည်။

အောက်ဖော်ပြပါကုဒ်သည် ဆုတ်ယုတ်မှုပုံစံနှစ်ခုကြားရှိ အကြွင်းအကျန်များကို မြင်သာစေရန် R တွင် QQ အကွက် နှစ်ခုကို ဖန်တီးနည်းကို ပြသသည်-

 #define plotting area
op <- par(pty = "s", mfrow = c(1, 2))

#QQ plot for original model
qqnorm(model$residuals)
qqline(model$residuals)

#QQ plot for Box-Cox transformed model
qqnorm(new_model$residuals)
qqline(new_model$residuals)

#display both QQ plots
by(op)

R ဖြင့် Box-Cox ဖြင့် ပြောင်းလဲထားသော QQ နယ်မြေ

ယေဘူယျအားဖြင့်၊ ဒေတာအမှတ်များသည် QQ ကွက်ကွက်တစ်ခုရှိ ဖြောင့်ထောင့်ဖြတ်မျဉ်းတစ်လျှောက်တွင် ရှိနေပါက၊ ဒေတာအစုံသည် ပုံမှန်ဖြန့်ဝေမှုနောက်ဆက်တွဲဖြစ်နိုင်သည်။

box-cox အသွင်ပြောင်းမော်ဒယ်သည် မူရင်းဆုတ်ယုတ်မှုမော်ဒယ်ထက် များစွာဖြောင့်တန်းသော QQ ကွက်ကွက်ကို မည်သို့ထုတ်လုပ်သည်ကို သတိပြုပါ။

၎င်းသည် အကွက်-ကော့စ်အသွင်ပြောင်းထားသော မော်ဒယ်၏ အကြွင်းအကျန်များကို ပုံမှန်အတိုင်း ဖြန့်ဝေနေသည်၊ ၎င်းသည် linear regression ၏ ယူဆချက် တစ်ခုအား ကျေနပ်စေသည်။

ထပ်လောင်းအရင်းအမြစ်များ

R (Log၊ Square Root၊ Cube Root) ဖြင့် Data ကိုဘယ်လိုပြောင်းမလဲ
R တွင် QQ ကွက်ကွက်တစ်ခုကို ဖန်တီးပြီး အဓိပ္ပာယ်ဖွင့်နည်း
R တွင်ပုံမှန်ဖြစ်ရန်အတွက် Shapiro-Wilk စမ်းသပ်နည်း

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ဥပမာ- R in Box-Cox အသွင်ပြောင်းခြင်း

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။