R'de na.rm nasıl kullanılır (örneklerle)


R’de tanımlayıcı istatistikleri hesaplarken eksik değerleri hariç tutmak için na.rm=TRUE bağımsız değişkenini kullanabilirsiniz.

 #calculate mean and exclude missing values
mean(x, na. rm = TRUE )

#calculate sum and exclude missing values 
sum(x, na. rm = TRUE )

#calculate maximum and exclude missing values 
max(x, na. rm = TRUE )

#calculate standard deviation and exclude missing values 
sd(x, na. rm = TRUE )

Aşağıdaki örnekler bu argümanın pratikte vektörler ve veri çerçeveleri ile nasıl kullanılacağını göstermektedir.

Örnek 1: na.rm’yi vektörlerle kullanma

R’de eksik değerleri içeren aşağıdaki vektörün ortalamasını, toplamını, maksimumunu ve standart sapmasını hesaplamaya çalıştığımızı varsayalım:

 #define vector with some missing values
x <- c(3, 4, 5, 5, 7, NA, 12, NA, 16)

mean(x)

[1] NA

sum(x)

[1] NA

max(x)

[1] NA

sd(x)

[1] NA

Bu işlevlerin her biri bir NA değeri döndürür.

Bu hesaplamaları yaparken eksik değerleri hariç tutmak için na.rm = TRUE argümanını aşağıdaki gibi dahil edebiliriz:

 #define vector with some missing values
x <- c(3, 4, 5, 5, 7, NA, 12, NA, 16)

mean(x, na. rm = TRUE )

[1] 7.428571

sum(x, na. rm = TRUE )

[1] 52

max(x, na. rm = TRUE )

[1] 16

sd(x, na. rm = TRUE )

[1] 4.790864

Eksik değerleri hariç tutarak her hesaplamayı başarıyla gerçekleştirebildiğimizi unutmayın.

Örnek 2: na.rm’yi veri çerçeveleriyle kullanma

R’de eksik değerleri içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, NA, 3, 2),
                 var3=c(3, 3, NA, 6, 8),
                 var4=c(1, 1, 2, 8, NA))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 NA NA 2
4 4 3 6 8
5 5 2 8 NA

Veri çerçevesindeki her bir sütun için tanımlayıcı istatistikleri hesaplamak için application() işlevini kullanabiliriz ve bu hesaplamaları gerçekleştirirken eksik değerleri hariç tutmak için na.rm = TRUE bağımsız değişkenini kullanabiliriz:

 #calculate mean of each column
apply(df, 2, mean, na. rm = TRUE )

var1 var2 var3 var4 
3.20 4.75 5.00 3.00 

#calculate sum of each column
apply(df, 2, sum, na. rm = TRUE )

var1 var2 var3 var4 
  16 19 20 12 

#calculate max of each column
apply(df, 2, max, na. rm = TRUE )

var1 var2 var3 var4 
   5 7 8 8 

#calculate standard deviation of each column
apply(df, 2, sd, na. rm = TRUE )

    var1 var2 var3 var4 
1.483240 2.629956 2.449490 3.366502

Bir kez daha eksik değerleri hariç tutarak her hesaplamayı başarıyla tamamlamayı başardık.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de eksik değerlerle diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de is.null nasıl kullanılır?
R’de na.omit nasıl kullanılır
R’de is.na nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir