R'de yinelenen satırları kaldırma (örneklerle)

İle Dr.benjamin anderson Temmuz 23, 2023 Rehber 0 Yorum

R’deki bir veri çerçevesinden yinelenen satırları kaldırmak için iki yöntemden birini kullanabilirsiniz:

Yöntem 1: Base R’yi kullanın

 #remove duplicate rows across entire data frame
df[ ! duplicated(df), ]

#remove duplicate rows across specific columns of data frame
df[ ! duplicated(df[c(' var1 ')]), ]

Yöntem 2: dplyr’ı kullanın

 #remove duplicate rows across entire data frame 
df %>%
  distinct(.keep_all = TRUE )

#remove duplicate rows across specific columns of data frame
df %>%
  distinct(var1, .keep_all = TRUE )

Aşağıdaki örnekler, bu sözdiziminin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('Guard', 'Guard', 'Forward', 'Guard', 'Center', 'Center'))

#view data frame
df

  team position
1A Guard
2 A Guard
3 A Forward
4 B Guard
5B Center
6B Center

Örnek 1: Base R’yi kullanarak yinelenen satırları kaldırın

Aşağıdaki kod, R taban işlevlerini kullanarak yinelenen satırların bir veri çerçevesinden nasıl kaldırılacağını gösterir:

 #remove duplicate rows from data frame
df[ ! duplicated(df), ]

  team position
1A Guard
3 A Forward
4 B Guard
5B Center

Aşağıdaki kod, R tabanını kullanarak bir veri çerçevesindeki belirli sütunlardan yinelenen satırların nasıl kaldırılacağını gösterir:

 #remove rows where there are duplicates in the 'team' column
df[ ! duplicated(df[c(' team ')]), ]

  team position
1A Guard
4 B Guard

Örnek 2: Dplyr kullanarak yinelenen satırları kaldırın

Aşağıdaki kod, dplyr paketindeki Different() işlevini kullanarak yinelenen satırların bir veri çerçevesinden nasıl kaldırılacağını gösterir:

 library (dplyr)

#remove duplicate rows from data frame
df %>%
  distinct(.keep_all = TRUE )

  team position
1A Guard
2 A Forward
3 B Guard
4B Center

.keep_all argümanının R’ye tüm sütunları orijinal veri çerçevesinde tutmasını söylediğini unutmayın.

Aşağıdaki kod, bir veri çerçevesindeki belirli sütunlardan yinelenen satırları kaldırmak için Different() işlevinin nasıl kullanılacağını gösterir:

 library (dplyr)

#remove duplicate rows from data frame
df %>%
  distinct(team, .keep_all = TRUE )

  team position
1A Guard
2 B Guard

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak işlevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Koşula bağlı olarak R’deki satırlar nasıl silinir
R’de belirli bir sütunda NA bulunan satırlar nasıl silinir

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek 1: Base R’yi kullanarak yinelenen satırları kaldırın

Örnek 2: Dplyr kullanarak yinelenen satırları kaldırın

Ek kaynaklar

yazar hakkında

Dr.benjamin anderson

Yorum ekle