R'de eksik değerler nasıl bulunur ve sayılır (örneklerle)


R’de eksik değerleri bulmak ve saymak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Eksik Değerlerin Konumunu Bulun

 which( is.na (df$column_name))

Yöntem 2: Toplam eksik değerleri sayın

 sum( is.na (df$column_name))

Aşağıdaki örnekler bu fonksiyonların pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Bir sütundaki eksik değerleri bulun ve sayın

Aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

“Assist” sütununda eksik değerleri olan pozisyonları belirlemek ve “assist” sütununda toplam eksik değerleri bulmak için aşağıdaki kodu kullanabiliriz:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

Sonuçtan, ‘asist’ sütununda 1 , 3 ve 4 numaralı pozisyonların eksik değerleri olduğunu ve sütunda toplam 3 eksik değerin bulunduğunu görebiliyoruz.

Örnek 2: Tüm sütunlardaki eksik değerleri sayın

Aşağıdaki kod, bir veri çerçevesinin her sütunundaki toplam eksik değerlerin nasıl sayılacağını gösterir:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

Sonuçtan şunu görebiliriz:

  • “Takım” sütununda 1 eksik değer var.
  • “Puan” sütunu 0 eksik değer içeriyor.
  • “Yardım” sütununda 3 eksik değer var.
  • “Geri tepmeler” sütununda 1 eksik değer var.

Örnek 3: Tüm veri çerçevesindeki eksik değerleri sayın

Aşağıdaki kod, bir veri çerçevesinin tamamındaki toplam eksik değerlerin nasıl sayılacağını gösterir:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

Sonuçtan tüm veri çerçevesinde toplamda 5 adet eksik değerin olduğunu görebiliriz.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de eksik değerlerle diğer genel işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Eksik değerlerin tümü R’ye nasıl aktarılır?
NA’lar R’deki dizelerle nasıl değiştirilir?
Dplyr’de NA’yı Sıfır ile nasıl değiştirebilirim?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir