R'de veriler eşit büyüklükteki gruplara nasıl bölünür
Bir vektörü eşit büyüklükteki gruplara bölmek için R’deki ggplot2 paketinin Cut_number() işlevini kullanabilirsiniz.
Bu işlev aşağıdaki temel sözdizimini kullanır:
kesim_numarası(x,n)
Altın:
- x: Bölünecek dijital vektörün adı
- n: Grup sayısı
Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.
Örnek: Veriler R’de eşit büyüklükteki gruplara nasıl bölünür?
R’de 12 farklı basketbolcunun attığı puanlar hakkında bilgi içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım.
#create data frame df <- data. frame (player=LETTERS[1:12], points=c(1, 2, 2, 2, 4, 5, 7, 9, 12, 14, 15, 22)) #view data frame df player points 1 to 1 2 B 2 3 C 2 4 D 2 5 E 4 6 F 5 7 G 7 8:9 a.m. 9 I 12 10 D 14 11K15 12 L 22
İlgili: R’de HARFLER işlevi nasıl kullanılır?
Veri çerçevesinin her satırını, puan sütunundaki değere göre üç gruptan birine bölen, grup adı verilen yeni bir sütun oluşturmak için ggplot2 paketindeki Cut_number() işlevini kullanabiliriz:
library (ggplot2) #create new column that splits data into three equal sized groups based on points df$group <- cut_number(df$points, 3) #view updated data frame df player points group 1 To 1 [1,3.33] 2 B 2 [1,3.33] 3 C 2 [1,3.33] 4 D 2 [1,3.33] 5 E 4 (3.33.10] 6 F 5 (3.33.10] 7 G 7 (3.33.10] 8 A.M. 9 (3.33.10] 9 I 12 (10.22] 10 J 14 (10.22] 11 K 15 (10.22] 12 L 22 (10.22]
12 oyuncunun her biri, puan sütununda gösterilen değere göre üç gruptan birine yerleştirildi.
Sonuçtan 3 farklı grubun olduğunu görebiliriz:
- Grup 1: Puanların değeri 1 ile 3,33 arasındadır.
- grup 2: puanların değeri 3,33 ile 10 arasındadır.
- Grup 3: Puanların değeri 10 ile 22 arasındadır.
Her gruba dört oyuncunun yerleştirildiğini görüyoruz.
Grup sütununun grupları tam sayı değerleri olarak görüntülemesini istiyorsanız, Cut_number() işlevini bir as.numeric() işlevine sarabilirsiniz:
library (ggplot2) #create new column that splits data into three equal sized groups based on points df$group <- as. numeric (cut_number(df$points, 3)) #view updated data frame df player points group 1 A 1 1 2 B 2 1 3 C 2 1 4 D 2 1 5 E 4 2 6 F 5 2 7 G 7 2 8:92 a.m. 9 I 12 3 10 D 14 3 11 K 15 3 12 L 22 3
Yeni grup sütunu artık oyuncunun hangi gruba ait olduğunu belirtmek için 1, 2 ve 3 değerlerini içeriyor.
Yine her grupta dört oyuncu yer alıyor.
Not : Nokta sütununu üçten fazla gruba bölmek için, Cut_number() işlevindeki 3’ü farklı bir sayıyla değiştirmeniz yeterlidir.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’de bir veri çerçevesi nasıl bölünür
R’de veriler eğitim ve test kümelerine nasıl bölünür?
R’de veri gruplaması nasıl gerçekleştirilir?