R'de veriler eşit büyüklükteki gruplara nasıl bölünür


Bir vektörü eşit büyüklükteki gruplara bölmek için R’deki ggplot2 paketinin Cut_number() işlevini kullanabilirsiniz.

Bu işlev aşağıdaki temel sözdizimini kullanır:

kesim_numarası(x,n)

Altın:

  • x: Bölünecek dijital vektörün adı
  • n: Grup sayısı

Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.

Örnek: Veriler R’de eşit büyüklükteki gruplara nasıl bölünür?

R’de 12 farklı basketbolcunun attığı puanlar hakkında bilgi içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım.

 #create data frame
df <- data. frame (player=LETTERS[1:12],
                 points=c(1, 2, 2, 2, 4, 5, 7, 9, 12, 14, 15, 22))

#view data frame
df

   player points
1 to 1
2 B 2
3 C 2
4 D 2
5 E 4
6 F 5
7 G 7
8:9 a.m.
9 I 12
10 D 14
11K15
12 L 22

İlgili: R’de HARFLER işlevi nasıl kullanılır?

Veri çerçevesinin her satırını, puan sütunundaki değere göre üç gruptan birine bölen, grup adı verilen yeni bir sütun oluşturmak için ggplot2 paketindeki Cut_number() işlevini kullanabiliriz:

 library (ggplot2)

#create new column that splits data into three equal sized groups based on points
df$group <- cut_number(df$points, 3)

#view updated data frame
df

   player points group
1 To 1 [1,3.33]
2 B 2 [1,3.33]
3 C 2 [1,3.33]
4 D 2 [1,3.33]
5 E 4 (3.33.10]
6 F 5 (3.33.10]
7 G 7 (3.33.10]
8 A.M. 9 (3.33.10]
9 I 12 (10.22]
10 J 14 (10.22]
11 K 15 (10.22]
12 L 22 (10.22]

12 oyuncunun her biri, puan sütununda gösterilen değere göre üç gruptan birine yerleştirildi.

Sonuçtan 3 farklı grubun olduğunu görebiliriz:

  • Grup 1: Puanların değeri 1 ile 3,33 arasındadır.
  • grup 2: puanların değeri 3,33 ile 10 arasındadır.
  • Grup 3: Puanların değeri 10 ile 22 arasındadır.

Her gruba dört oyuncunun yerleştirildiğini görüyoruz.

Grup sütununun grupları tam sayı değerleri olarak görüntülemesini istiyorsanız, Cut_number() işlevini bir as.numeric() işlevine sarabilirsiniz:

 library (ggplot2)

#create new column that splits data into three equal sized groups based on points
df$group <- as. numeric (cut_number(df$points, 3))

#view updated data frame
df

   player points group
1 A 1 1
2 B 2 1
3 C 2 1
4 D 2 1
5 E 4 2
6 F 5 2
7 G 7 2
8:92 a.m.
9 I 12 3
10 D 14 3
11 K 15 3
12 L 22 3

Yeni grup sütunu artık oyuncunun hangi gruba ait olduğunu belirtmek için 1, 2 ve 3 değerlerini içeriyor.

Yine her grupta dört oyuncu yer alıyor.

Not : Nokta sütununu üçten fazla gruba bölmek için, Cut_number() işlevindeki 3’ü farklı bir sayıyla değiştirmeniz yeterlidir.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de bir veri çerçevesi nasıl bölünür
R’de veriler eğitim ve test kümelerine nasıl bölünür?
R’de veri gruplaması nasıl gerçekleştirilir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir