R'de bir veri çerçevesindeki tek satırlar nasıl seçilir


R’de bir veri çerçevesindeki tek satırları seçmek için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Tüm Sütunlarda Tek Satırları Seçin

 library (dplyr)

df %>% distinct()

Yöntem 2: Bir Sütuna Göre Tek Satırları Seçin

 library (dplyr)

df %>% distinct(column1, . keep_all = TRUE )

Yöntem 3: Birden Çok Sütuna Dayalı Tek Satırları Seçme

 library (dplyr)

df %>% distinct(column1, column2, . keep_all = TRUE )

Bu eğitimde her yöntemin pratikte aşağıdaki veri çerçevesiyle nasıl kullanılacağı açıklanmaktadır:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(10, 10, 8, 14, 15, 15, 17, 17))

#view data frame
df

  team position points
1 AG 10
2 AG 10
3AF 8
4 AF 14
5 BG 15
6 BG 15
7 BF 17
8 BF 17

Örnek 1: Tüm sütunlardaki benzersiz satırları seçin

Aşağıdaki kod, veri çerçevesindeki tüm sütunlarda benzersiz değerlere sahip satırların nasıl seçileceğini gösterir:

 library (dplyr)

#select rows with unique values across all columns
df %>% distinct()

  team position points
1 AG 10
2AF 8
3 AF 14
4 BG 15
5 BF 17

Veri çerçevesinde beş benzersiz satırın olduğunu görebiliriz.

Not : Yinelenen satırlarla karşılaşıldığında yalnızca ilk benzersiz satır korunur.

Örnek 2: Bir Sütuna Göre Tek Satır Seçme

Aşağıdaki kod, yalnızca ekip sütununa göre tek satırların nasıl seçileceğini gösterir.

 library (dplyr)

#select rows with unique values based on team column only
df %>% distinct(team, . keep_all = TRUE )

  team position points
1 AG 10
2 BG 15

Takım sütununda yalnızca iki benzersiz değer bulunduğundan, her değerin yalnızca ilk geçtiği satırlar tutulur.

Not : .keep_all=TRUE argümanı R’ye çıktıdaki diğer tüm sütunları tutmasını söyler.

Örnek 3: Birden Çok Sütuna Göre Tek Satır Seçme

Aşağıdaki kod, yalnızca ekip ve konum sütunlarına göre tek satırların nasıl seçileceğini gösterir.

 library (dplyr)

#select rows with unique values based on team and position columns only
df %>% distinct(team, position, . keep_all = TRUE )

  team position points
1 AG 10
2AF 8
3 BG 15
4 BF 17

Takım ve Pozisyon sütunlarında dört benzersiz değer kombinasyonu bulunduğundan dört satır döndürülür.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Dplyr kullanarak benzersiz değerler nasıl filtrelenir
Dplyr kullanarak birden çok koşula göre filtreleme nasıl yapılır
R’deki sütunlardaki oluşum sayısı nasıl sayılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir