R'de yinelenen satırlar nasıl kaldırılır, böylece hiçbir şey kalmaz


Ortaya çıkan veri çerçevesinde hiçbirinin kalmaması için bir veri çerçevesinden yinelenen satırları kaldırmak için R’de aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Base R’yi kullanın

 new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]

Yöntem 2: dplyr’ı kullanın

 library (dplyr)

new_df <- df %>%
          group_by(across(everything())) %>%
          filter(n() == 1 )

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(20, 20, 28, 14, 13, 18, 27, 13))

#view data frame
df

  team points
1 to 20
2 to 20
3 to 28
4 to 14
5 B 13
6 B 18
7 B 27
8 B 13

Örnek 1: Temel R’yi kullanın

Aşağıdaki kod, yinelenen satırları veri çerçevesinden kaldırmak ve böylece hiçbir satır kalmamasını sağlamak için R taban işlevlerinin nasıl kullanılacağını gösterir:

 #create new data frame that removes duplicates so none are left
new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ]

#view new data frame
new_df

  team points
3 to 28
4 to 14
6 B 18
7 B 27

Yinelenen satırların her birinin veri çerçevesinden kaldırıldığını ve yinelenenlerin hiçbirinin tutulmadığını unutmayın.

Örnek 2: dplyr kullanma

Aşağıdaki kod, yinelenen satırları veri çerçevesinden kaldırmak ve hiçbirinin kalmamasını sağlamak için R’deki dplyr paketindeki işlevlerin nasıl kullanılacağını gösterir:

 library (dplyr)

#create new data frame that removes duplicates so none are left
new_df <- df %>%
          group_by(across(everything())) %>%
          filter(n() == 1 )

#view new data frame
new_df

# A tibble: 4 x 2
# Groups: team, points [4]
  team points
    
1 to 28
2 to 14
3 B 18
4 B 27

Yinelenen satırların her birinin veri çerçevesinden kaldırıldığını ve yinelenenlerin hiçbirinin tutulmadığını unutmayın.

Ayrıca bunun önceki yöntemle aynı sonucu verdiğini unutmayın.

Not : Aşırı büyük veri çerçeveleri için dplyr yöntemi temel R yönteminden daha hızlı olacaktır.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Koşula bağlı olarak R’deki satırlar nasıl silinir
R’de belirli bir sütunda NA bulunan satırlar nasıl silinir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir