R'de yinelenen satırları kaldırma (örneklerle)
R’deki bir veri çerçevesinden yinelenen satırları kaldırmak için iki yöntemden birini kullanabilirsiniz:
Yöntem 1: Base R’yi kullanın
#remove duplicate rows across entire data frame df[ ! duplicated(df), ] #remove duplicate rows across specific columns of data frame df[ ! duplicated(df[c(' var1 ')]), ]
Yöntem 2: dplyr’ı kullanın
#remove duplicate rows across entire data frame df %>% distinct(.keep_all = TRUE ) #remove duplicate rows across specific columns of data frame df %>% distinct(var1, .keep_all = TRUE )
Aşağıdaki örnekler, bu sözdiziminin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('Guard', 'Guard', 'Forward', 'Guard', 'Center', 'Center')) #view data frame df team position 1A Guard 2 A Guard 3 A Forward 4 B Guard 5B Center 6B Center
Örnek 1: Base R’yi kullanarak yinelenen satırları kaldırın
Aşağıdaki kod, R taban işlevlerini kullanarak yinelenen satırların bir veri çerçevesinden nasıl kaldırılacağını gösterir:
#remove duplicate rows from data frame
df[ ! duplicated(df), ]
team position
1A Guard
3 A Forward
4 B Guard
5B Center
Aşağıdaki kod, R tabanını kullanarak bir veri çerçevesindeki belirli sütunlardan yinelenen satırların nasıl kaldırılacağını gösterir:
#remove rows where there are duplicates in the 'team' column
df[ ! duplicated(df[c(' team ')]), ]
team position
1A Guard
4 B Guard
Örnek 2: Dplyr kullanarak yinelenen satırları kaldırın
Aşağıdaki kod, dplyr paketindeki Different() işlevini kullanarak yinelenen satırların bir veri çerçevesinden nasıl kaldırılacağını gösterir:
library (dplyr) #remove duplicate rows from data frame df %>% distinct(.keep_all = TRUE ) team position 1A Guard 2 A Forward 3 B Guard 4B Center
.keep_all argümanının R’ye tüm sütunları orijinal veri çerçevesinde tutmasını söylediğini unutmayın.
Aşağıdaki kod, bir veri çerçevesindeki belirli sütunlardan yinelenen satırları kaldırmak için Different() işlevinin nasıl kullanılacağını gösterir:
library (dplyr) #remove duplicate rows from data frame df %>% distinct(team, .keep_all = TRUE ) team position 1A Guard 2 B Guard
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Koşula bağlı olarak R’deki satırlar nasıl silinir
R’de belirli bir sütunda NA bulunan satırlar nasıl silinir