R'de eksik değerlerin enterpolasyonu nasıl yapılır (bir örnek dahil)
R’deki bir veri çerçevesi sütunundaki eksik değerlerin enterpolasyonunu yapmak için aşağıdaki temel sözdizimini kullanabilirsiniz:
library (dplyr) library (zoo) df <- df %>% mutate(column_name = na. approx (column_name))
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: R’de Eksik Değerlerin Enterpolasyonu
R’de bir mağazanın ardı ardına 15 gün boyunca yaptığı toplam satışları gösteren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#create data frame df <- data. frame (day=1:15, sales=c(3, 6, 8, 10, 14, 17, 20, NA, NA, NA, NA, 35, 39, 44, 49)) #view data frame df day sales 1 1 3 2 2 6 3 3 8 4 4 10 5 5 14 6 6 17 7 7 20 8 8 NA 9 9 NA 10 10 NA 11 11 NA 12 12 35 13 13 39 14 14 44 15 15 49
Veri çerçevesinde dört günlük satış rakamlarının eksik olduğunu unutmayın.
Zaman içindeki satışları görselleştirmek için basit bir çizgi grafik oluştursaydık şöyle görünürdü:
#create line chart to visualize sales plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ')
Eksik değerleri doldurmak için, zoo paketindeki na.approx() işlevinin yanı sıra dplyr paketindeki mutate() işlevini de kullanabiliriz:
library (dplyr) library (zoo) #interpolate missing values in 'sales' column df <- df %>% mutate(sales = na. approx (sales)) #view updated data frame df day sales 1 1 3 2 2 6 3 3 8 4 4 10 5 5 14 6 6 17 7 7 20 8 8 23 9 9 26 10 10 29 11 11 32 12 12 35 13 13 39 14 14 44 15 15 49
Eksik değerlerin her birinin değiştirildiğini unutmayın.
Güncellenmiş veri çerçevesini görselleştirmek için başka bir çizgi grafik oluşturursak şöyle görünür:
#create line chart to visualize sales plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ')
na.approx() işlevi tarafından seçilen değerlerin, verilerin trendiyle oldukça iyi eşleştiğini unutmayın.
Ek kaynaklar
Aşağıdaki eğitimler, R’de eksik değerlerin nasıl ele alınacağı hakkında ek bilgi sağlar:
R’de eksik değerler nasıl bulunur ve sayılır
Eksik değerlerin tümü R’ye nasıl aktarılır?
R’de is.na işlevi nasıl kullanılır?