R'de cut () işlevi nasıl kullanılır?


R’deki Cut() işlevi, bir dizi değeri bölmelere ayırmak ve her bölme için etiket belirlemek için kullanılabilir.

Bu işlev aşağıdaki sözdizimini kullanır:

kesim(x, sonlar, etiketler = NULL, …)

Altın:

  • x : Vektör adı
  • break : Yapılacak mola sayısı veya kırılma noktalarının vektörü
  • etiketler : ortaya çıkan kutular için etiketler

Aşağıdaki örnekler, R’de aşağıdaki veri çerçevesiyle bu işlevin farklı senaryolarda nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'),
                 points=c(4, 7, 8, 12, 14, 16, 20, 26, 36))

#view data frame
df

  player points
1 to 4
2 B 7
3 C 8
4 D 12
5 E 14
6 F 16
7 G 20
8:26 a.m.
9 I 36

Örnek 1: Vektörü kırılma sayısına göre kesin

Aşağıdaki kod , nokta sütununu dört eşit boyuttaki gruplara bölen, kategori adı verilen yeni bir sütun oluşturmak için Cut() işlevinin nasıl kullanılacağını gösterir:

 #create new column that places each player into four categories based on points
df$category <- cut(df$points, breaks= 4 )

#view updated data frame
df

  player points category
1 to 4 (3.97.12]
2 B 7 (3.97.12]
3 C 8 (3.97.12]
4 D 12 (3.97.12]
5 E 14 (12.20]
6 F 16 (12.20]
7 G 20 (12.20]
8:26 a.m. (20.28]
9 I 36 (28.36]

break=4 belirttiğimiz için, Cut() fonksiyonu nokta sütunundaki değerleri dört eşit büyüklükteki gruplara böler.

Cut() fonksiyonunun bunu nasıl yaptığı aşağıda açıklanmıştır:

  • Öncelikle puan sütunundaki en büyük ve en küçük değerler arasındaki farkı buldu (36 – 4 = 32).
  • Daha sonra bu farkı 4’e böler (32/4=8)
  • Sonuç, her biri 8 genişliğinde dört kutudur.

Not : Cut() belgelerindeki aşağıdaki işlevsellik nedeniyle en düşük aralık 4 yerine 3,97’dir:

Duraklamalar tek bir sayı olarak belirtildiğinde, veri aralığı eşit uzunluktaki duraklama parçalarına bölünür ve ardından aykırı değerlerin her iki duraklama aralığında da olmasını sağlamak için dış sınırlar aralıktan %0,1 uzağa taşınır.

Örnek 2: Belirli kesme noktalarına dayalı kesme vektörü

Aşağıdaki kod, belirli kesme noktalarının bir vektörüne dayalı olarak noktalar sütununu kesen, kategori adı verilen yeni bir sütun oluşturmak için Cut() işlevinin nasıl kullanılacağını gösterir:

 #create new column based on specific break points
df$category <- cut(df$points, breaks=c(0, 10, 15, 20, 40))

#view updated data frame
df

  player points category
1 to 4 (0.10]
2 B 7 (0.10]
3 C 8 (0.10]
4 D 12 (10.15]
5 E 14 (10.15]
6 F 16 (15.20]
7 G 20 (15.20]
8:26 a.m. (20.40)
9 I 36 (20.40]

Cut() işlevi, her oyuncuyu, sağladığımız belirli kesme noktaları vektörüne göre kategorilere ayırdı.

Örnek 3: Belirli Kesme Noktalarını ve Etiketleri Kullanarak Bir Vektörü Kesme

Aşağıdaki kod, özel etiketlere sahip belirli kesme noktalarının bir vektörünü temel alan noktalar sütununu kesen, kategori adı verilen yeni bir sütun oluşturmak için Cut() işlevinin nasıl kullanılacağını gösterir:

 #create new column based on values in points column
df$category <- cut(df$points,
                   breaks=c(0, 10, 15, 20, 40),
                   labels=c(' Bad ', ' OK ', ' Good ', ' Great '))

#view updated data frame
df

  player points category
1 A 4 Bad
2 B 7 Bad
3 C 8 Bad
4 D 12 OK
5 E 14 OK
6 F 16 Good
7 G 20 Good
8:26 A.M. Great
9 I 36 Great

Yeni kategori sütunu, puan sütunundaki karşılık gelen değere göre her oyuncuyu Kötü, Tamam, İyi veya Mükemmel olarak sıralar.

Not : Aşağıdaki hatayı önlemek için etiket sayısı her zaman kesme noktası sayısından bir eksik olmalıdır:

 Error in cut.default(df$points, breaks = c(0, 10, 15, 20, 40), labels = c("Bad",: 
  lengths of 'breaks' and 'labels' differ

Ek kaynaklar

Aşağıdaki eğitimlerde R’deki diğer yaygın işlevlerin nasıl kullanılacağı açıklanmaktadır:

R’de tabulate() işlevi nasıl kullanılır?
R’de split() işlevi nasıl kullanılır?
R’de match() işlevi nasıl kullanılır?
R’de replikasyon () işlevi nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir