R တွင် decision tree ကိုမည်သို့ဆွဲရမည် (ဥပမာနှင့်အတူ)


စက်သင်ယူမှု တွင်၊ ဆုံးဖြတ်ချက်သစ်ပင်သည် တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးကို ခန့်မှန်းပေးသည့် ဆုံးဖြတ်ချက်သစ်တစ်ခုဖန်တီးရန် ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို အသုံးပြုသည့် မော်ဒယ်အမျိုးအစားတစ်ခုဖြစ်သည်။

R တွင် ဆုံးဖြတ်ချက်သစ်တစ်ခုကို ချရန် အလွယ်ဆုံးနည်းလမ်းမှာ rpart.plot package မှ prp() function ကို အသုံးပြုခြင်းဖြစ်သည်။

အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။

ဥပမာ- R တွင် ဆုံးဖြတ်ချက်သစ်တစ်ခုဆွဲပါ။

ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် ပရော်ဖက်ရှင်နယ်ဘေ့စ်ဘောကစားသမား ၂၆၃ ဦး၏ အချက်အလက်များစွာပါရှိသော ISLR ပက်ကေ့ခ်ျမှ Hitters ဒေတာအတွဲကို အသုံးပြုပါမည်။

ပေးထားသည့် ကစားသမား၏လစာကို ခန့်မှန်းရန် အိမ်တွင်းပြေးပွဲများနှင့် နှစ်ပေါင်းများစွာ ကစားခဲ့သည့် ဆုတ်ယုတ်မှုသစ်ပင်ကို တည်ဆောက်ရန် ဤဒေတာအတွဲကို အသုံးပြုပါမည်။

အောက်ပါကုဒ်သည် ဤဆုတ်ယုတ်မှုသစ်ပင်နှင့် အံဝင်ခွင်ကျဖြစ်ပုံနှင့် သစ်ပင်ကိုဆွဲရန် prp() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-

 library (ISLR)
library (rpart)
library (rpart.plot)

#build the initial decision tree
tree <- rpart(Salary ~ Years + HmRun, data=Hitters, control=rpart. control (cp= .0001 ))

#identify best cp value to use
best <- tree$cptable[which. min (tree$cptable[," xerror "])," CP "]

#produce a pruned tree based on the best cp value
pruned_tree <- prune (tree, cp=best)

#plot the pruned tree
prp(pruned_tree)

prp () လုပ်ဆောင်ချက်ရှိ faclenအပိုroundint နှင့် digits အငြင်းအခုံများကို အသုံးပြု၍ ဆုံးဖြတ်ချက်သစ်ပင်၏အသွင်အပြင်ကို စိတ်ကြိုက်ပြင်ဆင်နိုင်သည်ကို သတိပြုပါ။

 #plot decision tree using custom arguments
prp(pruned_tree,
    faclen= 0 , #use full names for factor labels
    extra= 1 , #display number of observations for each terminal node
    roundint= F , #don't round to integers in output
    digits= 5 ) #display 5 decimal places in output 

R တွင် ဆုံးဖြတ်ချက်သစ်ကိုဆွဲပါ။

သစ်ပင်တွင် terminal node ခြောက်ခုရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်။

terminal node တစ်ခုစီသည် အဆိုပါ node အတွင်းရှိ ကစားသမားများ၏ ခန့်မှန်းလစာနှင့် ထိုအဆင့်သတ်မှတ်ချက်နှင့် သက်ဆိုင်သည့် မူရင်းဒေတာအတွဲထံမှ လေ့လာတွေ့ရှိချက်အရေအတွက်ကို ပြသသည်။

ဥပမာအားဖြင့်၊ မူရင်းဒေတာအတွဲတွင် အတွေ့အကြုံ 4.5 နှစ်အောက် ကစားသမား 90 ရှိပြီး ၎င်းတို့၏ ပျမ်းမျှလစာမှာ $225.83K ရှိကြောင်း ကျွန်ုပ်တို့တွေ့နိုင်သည်။

R ဖြင့် ဆုတ်ယုတ်မှုသစ်ပင်ကို စကားပြန်ဆိုခြင်း

၎င်းတို့၏ နှစ်ပေါင်းများစွာ အတွေ့အကြုံနှင့် အိမ်ကွင်းပျမ်းမျှ ပြေးနှုန်းအပေါ် အခြေခံ၍ ပေးထားသည့် ကစားသမား၏ လစာကို ခန့်မှန်းရန် သစ်ပင်ကို အသုံးပြုနိုင်သည်။

ဥပမာအားဖြင့်၊ အတွေ့အကြုံ 7 နှစ်ရှိပြီး အိမ်ကွင်း 4 ကြိမ်ပြေးသည့် ကစားသမားတစ်ဦးသည် ပျမ်းမျှလစာ $502.81k ရှိသည်။

R တွင် regression tree ၏ ဥပမာ

၎င်းသည် ဆုံးဖြတ်ချက်သစ်ပင်ကို အသုံးပြုခြင်း၏ အားသာချက်များထဲမှ တစ်ခုဖြစ်သည်- ကျွန်ုပ်တို့သည် ရလဒ်များကို အလွယ်တကူ မြင်ယောင်နိုင်ပြီး အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ဆုံးဖြတ်ချက်သစ်များအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-

အမျိုးအစားခွဲခြင်းနှင့် ဆုတ်ယုတ်မှုသစ်ပင်များအကြောင်း မိတ်ဆက်ခြင်း။
ဆုံးဖြတ်ချက်သစ်ပင်နှင့် ကျပန်းသစ်တောများ- ကွာခြားချက်ကား အဘယ်နည်း။
R တွင် အမျိုးအစားခွဲခြင်းနှင့် ဆုတ်ယုတ်ခြင်းသစ်ပင်များနှင့် အံကိုက်လုပ်နည်း

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်