R'de eksik değerlerin enterpolasyonu nasıl yapılır (bir örnek dahil)


R’deki bir veri çerçevesi sütunundaki eksik değerlerin enterpolasyonunu yapmak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 library (dplyr)
library (zoo)

df <- df %>%
        mutate(column_name = na. approx (column_name))

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: R’de Eksik Değerlerin Enterpolasyonu

R’de bir mağazanın ardı ardına 15 gün boyunca yaptığı toplam satışları gösteren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (day=1:15,
                 sales=c(3, 6, 8, 10, 14, 17, 20, NA, NA, NA, NA, 35, 39, 44, 49))

#view data frame
df

   day sales
1 1 3
2 2 6
3 3 8
4 4 10
5 5 14
6 6 17
7 7 20
8 8 NA
9 9 NA
10 10 NA
11 11 NA
12 12 35
13 13 39
14 14 44
15 15 49

Veri çerçevesinde dört günlük satış rakamlarının eksik olduğunu unutmayın.

Zaman içindeki satışları görselleştirmek için basit bir çizgi grafik oluştursaydık şöyle görünürdü:

 #create line chart to visualize sales
plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ') 

R'de eksik değerleri enterpolasyonla

Eksik değerleri doldurmak için, zoo paketindeki na.approx() işlevinin yanı sıra dplyr paketindeki mutate() işlevini de kullanabiliriz:

 library (dplyr)
library (zoo)

#interpolate missing values in 'sales' column
df <- df %>%
        mutate(sales = na. approx (sales))

#view updated data frame
df

   day sales
1 1 3
2 2 6
3 3 8
4 4 10
5 5 14
6 6 17
7 7 20
8 8 23
9 9 26
10 10 29
11 11 32
12 12 35
13 13 39
14 14 44
15 15 49

Eksik değerlerin her birinin değiştirildiğini unutmayın.

Güncellenmiş veri çerçevesini görselleştirmek için başka bir çizgi grafik oluşturursak şöyle görünür:

 #create line chart to visualize sales
plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ') 

na.approx() işlevi tarafından seçilen değerlerin, verilerin trendiyle oldukça iyi eşleştiğini unutmayın.

Ek kaynaklar

Aşağıdaki eğitimler, R’de eksik değerlerin nasıl ele alınacağı hakkında ek bilgi sağlar:

R’de eksik değerler nasıl bulunur ve sayılır
Eksik değerlerin tümü R’ye nasıl aktarılır?
R’de is.na işlevi nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir