A: her sütundaki na değerlerinin sayısını sayın


R’deki bir veri çerçevesinin her sütunundaki NA değerlerinin sayısını saymak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: R tabanını kullanarak her sütundaki NA değerlerini sayın

 sapply(df, function (x) sum(is. na (x)))

Yöntem 2: dplyr kullanarak her sütundaki NA değerlerini sayın

 library (dplyr)

df %>% summarise(across(everything(), ~ sum(is. na (.))))

Aşağıdaki örnekler, R’de her yöntemin aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, NA),
                 assists=c(33, NA, NA, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 90 NA 28
3 C 86 NA 24
4 D 88 39 24
5 E NA 34 28

Örnek 1: R tabanını kullanarak her sütundaki NA değerlerini sayın

Aşağıdaki kod, R base sapply() işlevini kullanarak her sütundaki NA değerlerinin sayısının nasıl sayılacağını gösterir:

 #count NA values in each column
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       0 1 2 0

Sonuçtan şunu görebiliriz:

  • Takım sütununda 0 NA değeri vardır.
  • Puan sütununda 1 NA değeri vardır.
  • Asist sütununda 2 NA değeri bulunur.
  • Geri dönen sütunun 0 NA değeri vardır.

Not : sapply() işlevi, veri çerçevesindeki her sütuna bir işlev uygulamak için kullanılabilir. Bu örnekte NA’ya eşit toplam eleman sayısını sayan bir fonksiyon uyguluyoruz.

Örnek 2: dplyr kullanarak her sütundaki NA değerlerini sayın

Aşağıdaki kod, dplyr paketindeki summarise() işlevini kullanarak her sütundaki NA değerlerinin sayısının nasıl sayılacağını gösterir:

 #count NA values in each column
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       0 1 2 0

Sonuçtan şunu görebiliriz:

  • Takım sütununda 0 NA değeri vardır.
  • Puan sütununda 1 NA değeri vardır.
  • Asist sütununda 2 NA değeri vardır.
  • Geri dönen sütunun 0 NA değeri vardır.

Bu sonuçlar önceki örneğin sonuçlarına karşılık gelir.

Not : Son derece büyük veri çerçeveleriyle çalışırken dplyr yöntemi temel R yönteminden daha hızlı olma eğilimindedir.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de na.omit nasıl kullanılır
R’decomplete.cases nasıl kullanılır
R’deki veri çerçevesinden boş satırlar nasıl kaldırılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir