كيفية رسم شجرة القرار في لغة r (مع مثال)


في التعلم الآلي ، شجرة القرار هي نوع من النماذج التي تستخدم مجموعة من المتغيرات المتوقعة لإنشاء شجرة قرارات تتنبأ بقيمة متغير الاستجابة.

أسهل طريقة لرسم شجرة القرار في R هي استخدام الدالة prp() من الحزمة rpart.plot .

يوضح المثال التالي كيفية استخدام هذه الوظيفة عمليًا.

مثال: رسم شجرة القرار في R

في هذا المثال، سوف نستخدم مجموعة بيانات Hitters من حزمة ISLR ، والتي تحتوي على معلومات متنوعة عن 263 لاعب بيسبول محترف.

سنستخدم مجموعة البيانات هذه لبناء شجرة تراجع تستخدم عدد مرات اللعب على أرضه وسنوات اللعب للتنبؤ براتب لاعب معين.

يوضح التعليمة البرمجية التالية كيفية ملاءمة شجرة الانحدار هذه وكيفية استخدام الدالة prp() لرسم الشجرة:

 library (ISLR)
library (rpart)
library (rpart.plot)

#build the initial decision tree
tree <- rpart(Salary ~ Years + HmRun, data=Hitters, control=rpart. control (cp= .0001 ))

#identify best cp value to use
best <- tree$cptable[which. min (tree$cptable[," xerror "])," CP "]

#produce a pruned tree based on the best cp value
pruned_tree <- prune (tree, cp=best)

#plot the pruned tree
prp(pruned_tree)

لاحظ أنه يمكننا أيضًا تخصيص مظهر شجرة القرار باستخدام الوسيطات faclen و extra و roundint و digits في الدالة prp ():

 #plot decision tree using custom arguments
prp(pruned_tree,
    faclen= 0 , #use full names for factor labels
    extra= 1 , #display number of observations for each terminal node
    roundint= F , #don't round to integers in output
    digits= 5 ) #display 5 decimal places in output 

ارسم شجرة القرار في R

يمكننا أن نرى أن الشجرة بها ست عقد طرفية.

تعرض كل عقدة طرفية الراتب المتوقع للاعبين في تلك العقدة بالإضافة إلى عدد الملاحظات من مجموعة البيانات الأصلية التي تنتمي إلى هذا التصنيف.

على سبيل المثال، يمكننا أن نرى أنه في مجموعة البيانات الأصلية، كان هناك 90 لاعبًا لديهم أقل من 4.5 سنوات من الخبرة وكان متوسط رواتبهم 225.83 ألف دولار .

تفسير شجرة الانحدار في R

يمكننا أيضًا استخدام الشجرة للتنبؤ براتب لاعب معين بناءً على سنوات خبرته ومتوسط مرات تشغيله على أرضه.

على سبيل المثال، اللاعب الذي لديه 7 سنوات من الخبرة و4 جولات منزلية في المتوسط لديه راتب متوقع قدره 502.81 ألف دولار .

مثال على شجرة الانحدار في R

هذه إحدى مزايا استخدام شجرة القرار: يمكننا بسهولة تصور النتائج وتفسيرها.

مصادر إضافية

توفر البرامج التعليمية التالية معلومات إضافية حول أشجار القرار:

مقدمة لأشجار التصنيف والانحدار
شجرة القرار مقابل الغابات العشوائية: ما الفرق؟
كيفية ملاءمة أشجار التصنيف والانحدار في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *