R တွင် decision tree ကိုမည်သို့ဆွဲရမည် (ဥပမာနှင့်အတူ)
စက်သင်ယူမှု တွင်၊ ဆုံးဖြတ်ချက်သစ်ပင်သည် တုံ့ပြန်မှုကိန်းရှင်၏တန်ဖိုးကို ခန့်မှန်းပေးသည့် ဆုံးဖြတ်ချက်သစ်တစ်ခုဖန်တီးရန် ကြိုတင်ခန့်မှန်းကိန်းရှင်များကို အသုံးပြုသည့် မော်ဒယ်အမျိုးအစားတစ်ခုဖြစ်သည်။
R တွင် ဆုံးဖြတ်ချက်သစ်တစ်ခုကို ချရန် အလွယ်ဆုံးနည်းလမ်းမှာ rpart.plot package မှ prp() function ကို အသုံးပြုခြင်းဖြစ်သည်။
အောက်ဖော်ပြပါ ဥပမာသည် ဤလုပ်ဆောင်ချက်ကို လက်တွေ့အသုံးချနည်းကို ပြသထားသည်။
ဥပမာ- R တွင် ဆုံးဖြတ်ချက်သစ်တစ်ခုဆွဲပါ။
ဤဥပမာအတွက်၊ ကျွန်ုပ်တို့သည် ပရော်ဖက်ရှင်နယ်ဘေ့စ်ဘောကစားသမား ၂၆၃ ဦး၏ အချက်အလက်များစွာပါရှိသော ISLR ပက်ကေ့ခ်ျမှ Hitters ဒေတာအတွဲကို အသုံးပြုပါမည်။
ပေးထားသည့် ကစားသမား၏လစာကို ခန့်မှန်းရန် အိမ်တွင်းပြေးပွဲများနှင့် နှစ်ပေါင်းများစွာ ကစားခဲ့သည့် ဆုတ်ယုတ်မှုသစ်ပင်ကို တည်ဆောက်ရန် ဤဒေတာအတွဲကို အသုံးပြုပါမည်။
အောက်ပါကုဒ်သည် ဤဆုတ်ယုတ်မှုသစ်ပင်နှင့် အံဝင်ခွင်ကျဖြစ်ပုံနှင့် သစ်ပင်ကိုဆွဲရန် prp() လုပ်ဆောင်ချက်ကို အသုံးပြုနည်းကို ပြသသည်-
library (ISLR) library (rpart) library (rpart.plot) #build the initial decision tree tree <- rpart(Salary ~ Years + HmRun, data=Hitters, control=rpart. control (cp= .0001 )) #identify best cp value to use best <- tree$cptable[which. min (tree$cptable[," xerror "])," CP "] #produce a pruned tree based on the best cp value pruned_tree <- prune (tree, cp=best) #plot the pruned tree prp(pruned_tree)

prp () လုပ်ဆောင်ချက်ရှိ faclen ၊ အပို ၊ roundint နှင့် digits အငြင်းအခုံများကို အသုံးပြု၍ ဆုံးဖြတ်ချက်သစ်ပင်၏အသွင်အပြင်ကို စိတ်ကြိုက်ပြင်ဆင်နိုင်သည်ကို သတိပြုပါ။
#plot decision tree using custom arguments
prp(pruned_tree,
faclen= 0 , #use full names for factor labels
extra= 1 , #display number of observations for each terminal node
roundint= F , #don't round to integers in output
digits= 5 ) #display 5 decimal places in output

သစ်ပင်တွင် terminal node ခြောက်ခုရှိသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည်။
terminal node တစ်ခုစီသည် အဆိုပါ node အတွင်းရှိ ကစားသမားများ၏ ခန့်မှန်းလစာနှင့် ထိုအဆင့်သတ်မှတ်ချက်နှင့် သက်ဆိုင်သည့် မူရင်းဒေတာအတွဲထံမှ လေ့လာတွေ့ရှိချက်အရေအတွက်ကို ပြသသည်။
ဥပမာအားဖြင့်၊ မူရင်းဒေတာအတွဲတွင် အတွေ့အကြုံ 4.5 နှစ်အောက် ကစားသမား 90 ရှိပြီး ၎င်းတို့၏ ပျမ်းမျှလစာမှာ $225.83K ရှိကြောင်း ကျွန်ုပ်တို့တွေ့နိုင်သည်။

၎င်းတို့၏ နှစ်ပေါင်းများစွာ အတွေ့အကြုံနှင့် အိမ်ကွင်းပျမ်းမျှ ပြေးနှုန်းအပေါ် အခြေခံ၍ ပေးထားသည့် ကစားသမား၏ လစာကို ခန့်မှန်းရန် သစ်ပင်ကို အသုံးပြုနိုင်သည်။
ဥပမာအားဖြင့်၊ အတွေ့အကြုံ 7 နှစ်ရှိပြီး အိမ်ကွင်း 4 ကြိမ်ပြေးသည့် ကစားသမားတစ်ဦးသည် ပျမ်းမျှလစာ $502.81k ရှိသည်။

၎င်းသည် ဆုံးဖြတ်ချက်သစ်ပင်ကို အသုံးပြုခြင်း၏ အားသာချက်များထဲမှ တစ်ခုဖြစ်သည်- ကျွန်ုပ်တို့သည် ရလဒ်များကို အလွယ်တကူ မြင်ယောင်နိုင်ပြီး အဓိပ္ပာယ်ဖွင့်ဆိုနိုင်သည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများသည် ဆုံးဖြတ်ချက်သစ်များအကြောင်း နောက်ထပ်အချက်အလက်များကို ပေးဆောင်သည်-
အမျိုးအစားခွဲခြင်းနှင့် ဆုတ်ယုတ်မှုသစ်ပင်များအကြောင်း မိတ်ဆက်ခြင်း။
ဆုံးဖြတ်ချက်သစ်ပင်နှင့် ကျပန်းသစ်တောများ- ကွာခြားချက်ကား အဘယ်နည်း။
R တွင် အမျိုးအစားခွဲခြင်းနှင့် ဆုတ်ယုတ်ခြင်းသစ်ပင်များနှင့် အံကိုက်လုပ်နည်း