R'de yinelenen satırları kaldırma (örneklerle)


R’deki bir veri çerçevesinden yinelenen satırları kaldırmak için iki yöntemden birini kullanabilirsiniz:

Yöntem 1: Base R’yi kullanın

 #remove duplicate rows across entire data frame
df[ ! duplicated(df), ]

#remove duplicate rows across specific columns of data frame
df[ ! duplicated(df[c(' var1 ')]), ]

Yöntem 2: dplyr’ı kullanın

 #remove duplicate rows across entire data frame 
df %>%
  distinct(.keep_all = TRUE )

#remove duplicate rows across specific columns of data frame
df %>%
  distinct(var1, .keep_all = TRUE )

Aşağıdaki örnekler, bu sözdiziminin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('Guard', 'Guard', 'Forward', 'Guard', 'Center', 'Center'))

#view data frame
df

  team position
1A Guard
2 A Guard
3 A Forward
4 B Guard
5B Center
6B Center

Örnek 1: Base R’yi kullanarak yinelenen satırları kaldırın

Aşağıdaki kod, R taban işlevlerini kullanarak yinelenen satırların bir veri çerçevesinden nasıl kaldırılacağını gösterir:

 #remove duplicate rows from data frame
df[ ! duplicated(df), ]

  team position
1A Guard
3 A Forward
4 B Guard
5B Center

Aşağıdaki kod, R tabanını kullanarak bir veri çerçevesindeki belirli sütunlardan yinelenen satırların nasıl kaldırılacağını gösterir:

 #remove rows where there are duplicates in the 'team' column
df[ ! duplicated(df[c(' team ')]), ]

  team position
1A Guard
4 B Guard

Örnek 2: Dplyr kullanarak yinelenen satırları kaldırın

Aşağıdaki kod, dplyr paketindeki Different() işlevini kullanarak yinelenen satırların bir veri çerçevesinden nasıl kaldırılacağını gösterir:

 library (dplyr)

#remove duplicate rows from data frame
df %>%
  distinct(.keep_all = TRUE )

  team position
1A Guard
2 A Forward
3 B Guard
4B Center

.keep_all argümanının R’ye tüm sütunları orijinal veri çerçevesinde tutmasını söylediğini unutmayın.

Aşağıdaki kod, bir veri çerçevesindeki belirli sütunlardan yinelenen satırları kaldırmak için Different() işlevinin nasıl kullanılacağını gösterir:

 library (dplyr)

#remove duplicate rows from data frame
df %>%
  distinct(team, .keep_all = TRUE )

  team position
1A Guard
2 B Guard

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Koşula bağlı olarak R’deki satırlar nasıl silinir
R’de belirli bir sütunda NA bulunan satırlar nasıl silinir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir