R에서 의사결정나무를 그리는 방법(예제 포함)

에 의해 벤자민 앤더슨 7월 17, 2023 가이드 댓글 0개

기계 학습 에서 의사 결정 트리는 일련의 예측 변수를 사용하여 응답 변수의 값을 예측하는 의사결정 트리를 생성하는 모델 유형입니다.

R에서 의사결정 트리를 그리는 가장 쉬운 방법은 rpart.plot 패키지의 prp() 함수를 사용하는 것입니다.

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예: R에서 의사결정 트리 그리기

이 예에서는 263명의 프로 야구 선수에 대한 다양한 정보가 포함된 ISLR 패키지의 Hitters 데이터 세트를 사용합니다.

우리는 이 데이터 세트를 사용하여 홈런과 플레이 기간을 사용하여 특정 선수의 연봉을 예측하는 회귀 트리를 구축할 것입니다.

다음 코드는 이 회귀 트리를 피팅하는 방법과 prp() 함수를 사용하여 트리를 그리는 방법을 보여줍니다.

 library (ISLR)
library (rpart)
library (rpart.plot)

#build the initial decision tree
tree <- rpart(Salary ~ Years + HmRun, data=Hitters, control=rpart. control (cp= .0001 ))

#identify best cp value to use
best <- tree$cptable[which. min (tree$cptable[," xerror "])," CP "]

#produce a pruned tree based on the best cp value
pruned_tree <- prune (tree, cp=best)

#plot the pruned tree
prp(pruned_tree)

prp () 함수의 faclen , extra , roundint 및 digits 인수를 사용하여 의사결정 트리의 모양을 사용자 정의할 수도 있습니다.

 #plot decision tree using custom arguments
prp(pruned_tree,
    faclen= 0 , #use full names for factor labels
    extra= 1 , #display number of observations for each terminal node
    roundint= F , #don't round to integers in output
    digits= 5 ) #display 5 decimal places in output

R로 의사결정나무 그리기