R'de karar ağacı nasıl çizilir (örnekle)


Makine öğreniminde karar ağacı , bir yanıt değişkeninin değerini tahmin eden bir karar ağacı oluşturmak için bir dizi tahmin değişkeni kullanan bir model türüdür.

R’de bir karar ağacı çizmenin en kolay yolu rpart.plot paketindeki prp() fonksiyonunu kullanmaktır.

Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.

Örnek: R’de bir karar ağacı çizmek

Bu örnek için, 263 profesyonel beyzbol oyuncusu hakkında çeşitli bilgiler içeren ISLR paketindeki Hitters veri setini kullanacağız.

Bu veri setini, belirli bir oyuncunun maaşını tahmin etmek için sayı sayısını ve oynanan yılları kullanan bir regresyon ağacı oluşturmak için kullanacağız.

Aşağıdaki kod, bu regresyon ağacının nasıl sığdırılacağını ve ağacı çizmek için prp() fonksiyonunun nasıl kullanılacağını gösterir:

 library (ISLR)
library (rpart)
library (rpart.plot)

#build the initial decision tree
tree <- rpart(Salary ~ Years + HmRun, data=Hitters, control=rpart. control (cp= .0001 ))

#identify best cp value to use
best <- tree$cptable[which. min (tree$cptable[," xerror "])," CP "]

#produce a pruned tree based on the best cp value
pruned_tree <- prune (tree, cp=best)

#plot the pruned tree
prp(pruned_tree)

prp () işlevindeki faclen , extra , roundint ve rakam bağımsız değişkenlerini kullanarak karar ağacının görünümünü de özelleştirebileceğimizi unutmayın:

 #plot decision tree using custom arguments
prp(pruned_tree,
    faclen= 0 , #use full names for factor labels
    extra= 1 , #display number of observations for each terminal node
    roundint= F , #don't round to integers in output
    digits= 5 ) #display 5 decimal places in output 

R'de bir karar ağacı çizin

Ağacın altı terminal düğümüne sahip olduğunu görebiliriz.

Her terminal düğümü, o düğümdeki oyuncuların tahmini maaşının yanı sıra, orijinal veri kümesinden o derecelendirmeye ait olan gözlem sayısını da görüntüler.

Örneğin, orijinal veri setinde 4,5 yıldan az deneyime sahip 90 oyuncunun bulunduğunu ve ortalama maaşlarının 225,83 bin dolar olduğunu görebiliyoruz.

R'de bir regresyon ağacını yorumlamak

Ağacı aynı zamanda belirli bir oyuncunun maaşını, yılların deneyimine ve ortalama sayılarına dayanarak tahmin etmek için de kullanabiliriz.

Örneğin, 7 yıllık tecrübeye sahip ve ortalama 4 home run yapan bir oyuncunun beklenen maaşı 502,81 bin dolar .

R'deki regresyon ağacı örneği

Karar ağacı kullanmanın avantajlarından biri de budur: Sonuçları kolayca görselleştirip yorumlayabiliriz.

Ek kaynaklar

Aşağıdaki eğitimler karar ağaçları hakkında ek bilgi sağlar:

Sınıflandırma ve regresyon ağaçlarına giriş
Karar ağacı ve rastgele ormanlar: fark nedir?
R’ye sınıflandırma ve regresyon ağaçları nasıl sığdırılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir