C: birden fazla sütundaki benzersiz satırlar nasıl bulunur?


R’de bir veri çerçevesinin birden çok sütunundaki benzersiz satırları bulmak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Birden çok sütundaki benzersiz satırları bulun (diğer sütunları kaldırın)

 df_unique <- unique(df[c(' col1 ', ' col2 ')])

Yöntem 2: Birden çok sütundaki benzersiz satırları bulun (diğer sütunları koruyun)

 df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]

Aşağıdaki örnekler, bu yöntemlerin her birinin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
                 pos=c('G', 'G', 'F', 'G', 'F', 'F'),
                 dots=c(33, 28, 31, 39, 34, 40))

#view data frame
df

  conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40

Yöntem 1: Birden çok sütundaki benzersiz satırları bulun (diğer sütunları kaldırın)

Aşağıdaki kod, veri çerçevesinin conf ve pos sütunlarındaki benzersiz satırların nasıl bulunacağını gösterir:

 #find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])

#view results
df_unique 

  conf pos
1 East G
3 East
4 West G
5 West

Sonuç dört benzersiz çizgidir.

Ayrıca puan sütununun sonuçlardan otomatik olarak kaldırıldığını unutmayın.

Yöntem 2: Birden Çok Sütundaki Tek Satırları Bul (Diğer Sütunları Kaldır)

Aşağıdaki kod, veri çerçevesinin conf ve pos sütunlarındaki tek satırların nasıl bulunacağını ve değerlerin puan sütununda nasıl tutulacağını gösterir:

 #find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]

#view results
df_unique 

  conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34

Conf ve pos sütunlarında yalnızca tek satırların bulunduğunu ve puan sütunundaki değerlerin korunduğunu unutmayın.

Yalnızca ilk benzersiz oluşumun değerinin korunduğuna dikkat etmek önemlidir.

Örneğin, ilk iki sütunda “Doğu” ve “G”yi içeren iki satır vardı, ancak son veri çerçevesinde yalnızca bu benzersiz kombinasyonun ilk oluşumuna ilişkin puan değeri (33) tutuldu.

Benzer şekilde, ilk iki sütunda “Batı” ve “F” içeren iki satır vardı, ancak son veri çerçevesinde yalnızca bu benzersiz kombinasyonun ilk oluşumuna ilişkin puan değeri (34) tutuldu.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’deki bir sütunda benzersiz değerler nasıl bulunur?
R’de gruba göre benzersiz değerler nasıl sayılır?
Dplyr kullanarak benzersiz değerler nasıl filtrelenir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir