R'deki kopyalar nasıl sayılır: örneklerle


R’deki bir veri çerçevesindeki kopyaları saymak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Bir sütundaki yinelenen değerleri sayın

 sum(duplicated(df$my_column))

Yöntem 2: Yinelenen satırları sayma

 nrow(df[duplicated(df), ])

Yöntem 3: Her benzersiz satır için kopyaları sayın

 library (dplyr)

df %>% group_by_all() %>% count

Aşağıdaki örnekler, R’deki aşağıdaki veri çerçevesiyle her yöntemin pratikte nasıl kullanılacağını gösterir:

 #create data frame
df = data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                position=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'),
                points=c(5, 5, 8, 10, 5, 7, 10, 10))

#view data frame
df

  team position points
1 GA 5
2 AG 5
3 AG 8
4 AF 10
5 BG 5
6 BG 7
7 BF 10
8 BF 10

Örnek 1: Bir sütundaki yinelenen değerleri sayma

Aşağıdaki kod, puan sütunundaki yinelenen değerlerin sayısının nasıl sayılacağını gösterir:

 #count number of duplicate values in points column
sum(duplicated(df$points))

[1] 4

Puan sütununda 4 adet yinelenen değerin olduğunu görebiliriz.

Örnek 2: Yinelenen satırları sayma

Aşağıdaki kod, veri çerçevesindeki yinelenen satırların sayısının nasıl sayılacağını gösterir:

 #count number of duplicate rows
nrow(df[duplicated(df), ])

[1] 2

Veri çerçevesinde 2 kopya satırın olduğunu görebiliriz.

Bu 2 yinelenen satırı görüntülemek için aşağıdaki sözdizimini kullanabiliriz:

 #display duplicated rows
df[duplicated(df), ]

  team position points
2 AG 5
8 BF 10

Örnek 3: Her benzersiz satır için kopyaları sayın

Aşağıdaki kod, veri çerçevesindeki her benzersiz satır için yinelenenlerin sayısının nasıl sayılacağını gösterir:

 library (dplyr)

#count number of duplicate rows in data frame
df %>% group_by_all() %>% count

# A tibble: 6 x 4
# Groups: team, position, points [6]
  team position points n
         
1 AF 10 1
2 AG 5 2
3 GA 8 1
4 BF 10 2
5 BG 5 1
6 BG 7 1

Sütun n, her benzersiz satır için kopya sayısını görüntüler.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Dplyr kullanarak yinelenen öğeler nasıl bulunur?
R’de yinelenen satırlar nasıl kaldırılır
R’de yinelenen satırlar nasıl kaldırılır, böylece hiçbir şey kalmaz

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir