R'de devam etmekten kategorik bir değişken nasıl oluşturulur?
Sürekli bir değişkenden kategorik bir değişken oluşturmak için R’deki Cut() işlevini kullanabilirsiniz.
Bu işlev aşağıdaki temel sözdizimini kullanır:
df$cat_variable <- cut(df$continuous_variable, breaks=c(5, 10, 15, 20, 25), labels=c(' A ', ' B ', ' C ', ' D '))
Break’lerin sürekli değişkenin bölüneceği değerleri, labels’ın ise yeni kategorik değişkenin değerlerine verilecek etiketi belirttiğini unutmayın.
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: R’deki süreklilikten kategorik bir değişken oluşturmak
R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(78, 82, 86, 94, 99, 104, 109, 110))
#view data frame
df
team points
1 To 78
2 B 82
3 C 86
4 D 94
5 E 99
6 F 104
7 G 109
8:11 a.m.
Şu anda puanlar sürekli bir değişkendir.
Kategorik bir değişkene ayırmak için Cut() fonksiyonunu kullanabiliriz:
#add new column that cuts 'points' into categories
df$cat <- cut(df$points,
breaks=c(70, 80, 90, 100, 110),
labels=c('Bad', 'OK', 'Good', 'Great'))
#view updated data frame
df
team points cat
1 To 78 Bad
2 B 82 OK
3 C 86 OK
4 D 94 Good
5 E 99 Good
6 F 104 Great
7 G 109 Great
8:110 Great
Kedi adında, veri çerçevesindeki her takımı puanlarına göre Kötü, Tamam, İyi veya Mükemmel olarak sıralayan yeni bir kategorik değişken oluşturduk.
Bu yeni değişkenin sınıfını kontrol etmek için class() fonksiyonunu kullanabiliriz:
#check class of 'cat' column
class(df$cat)
[1] “factor”
cat değişkeninin bir faktör olduğunu görüyoruz.
cat değişkenindeki her bir kategorinin oluşumlarını saymak için table() işlevini de kullanabiliriz:
#count occurrences of each category in 'cat' variable
table(df$cat)
Bad OK Good Great
1 2 2 3
Cut() işlevine bir labels argümanı sağlamazsanız, R’nin etiket olarak yalnızca aralık değerleri aralığını kullanacağını unutmayın:
#add new column that cuts 'points' into categories
df$cat <- cut(df$points, breaks=c(70, 80, 90, 100, 110))
#view updated data frame
df
team points cat
1 A 78 (70.80]
2 B 82 (80.90]
3 C 86 (80.90]
4 D 94 (90,100]
5 E 99 (90,100]
6 F 104 (100,110]
7 G 109 (100,110]
8:110 (100,110]
Bazı durumlarda bunu özel etiketler kullanmaya tercih edebilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’de kategorik değişkenler sayısala nasıl dönüştürülür?
R’de kategorik değişkenler nasıl oluşturulur?
R’de kategorik veriler nasıl çizilir