C: bir veri çerçevesinin satırının diğerinde mevcut olup olmadığını kontrol edin
R’deki bir veri çerçevesine, her satırın başka bir veri çerçevesinde mevcut olup olmadığını belirten yeni bir sütun eklemek için aşağıdaki sözdizimini kullanabilirsiniz:
df1$exists <- do. call (paste0, df1) %in% do. call (paste0, df2)
Bu özel sözdizimi , df1’deki her satırın df2 adı verilen başka bir veri çerçevesinde bulunup bulunmadığını belirtmek için DOĞRU veya YANLIŞ içeren df1 adlı veri çerçevesine, mevcut adlı bir sütun ekler.
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: R’de bir veri çerçevesindeki satırın diğerinde olup olmadığını kontrol edin
R’de aşağıdaki iki veri çerçevesine sahip olduğumuzu varsayalım:
#create first data frame
df1 <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
dots=c(12, 15, 22, 29, 24))
#view first data frame
df1
team points
1 to 12
2 B 15
3 C 22
4 D 29
5 E 24
#create second data frame
df2 <- data. frame (team=c('A', 'D', 'F', 'G', 'H'),
dots=c(12, 29, 15, 19, 10))
#view second data frame
df2
team points
1 to 12
2 D 29
3 F 15
4 G 19
5:10 a.m.
Her satırın ikinci veri çerçevesinde var olup olmadığını belirten ilk veri çerçevesine, mevcut adlı bir sütun eklemek için aşağıdaki sözdizimini kullanabiliriz:
#add new column to df1 that shows if row exists in df2
df1$exists <- do. call (paste0, df1) %in% do. call (paste0, df2)
#view updated data frame
df1
team points exists
1 TO 12 TRUE
2 B 15 FALSE
3 C 22 FALSE
4 D 29 TRUE
5 E 24 FALSE
Yeni sütun mevcut , ilk veri çerçevesindeki her satırın ikinci veri çerçevesinde mevcut olup olmadığını gösterir.
Sonuçtan şunları görebiliriz:
- df1’in ilk satırı df2’de mevcuttur.
- df1’in ikinci satırı df2’de mevcut değil.
- df1’in üçüncü satırı df2’de mevcut değil.
Ve benzeri.
Mevcut sütunda DOĞRU veya YANLIŞ yerine 1’leri ve 0’ları görüntülemek için is.numeric() işlevini de kullanabileceğinizi unutmayın:
#add new column to df1 that shows if row exists in df2
df1$exists <- as. numeric (do. call (paste0, df1) %in% do. call (paste0, df2))
#view updated data frame
df1
team points exists
1 to 12 1
2 B 15 0
3 C 22 0
4 D 29 1
5 E 24 0
1 değeri, ilk veri bloğundaki satırın ikincide mevcut olduğunu gösterir.
Tersine, 0 değeri, ilk veri çerçevesindeki satırın ikincide mevcut olmadığını gösterir.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
C: Birden fazla sütunun eşit olup olmadığı nasıl kontrol edilir?
C: Bir veri çerçevesindeki tek satırlar nasıl seçilir?
A: Bir veri çerçevesindeki satırlar nasıl çoğaltılır