Cara menginterpolasi nilai yang hilang di r (termasuk contoh)


Anda dapat menggunakan sintaks dasar berikut untuk menginterpolasi nilai yang hilang dalam kolom bingkai data di R:

 library (dplyr)
library (zoo)

df <- df %>%
        mutate(column_name = na. approx (column_name))

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Interpolasi Nilai yang Hilang di R

Misalkan kita memiliki kerangka data berikut di R yang menunjukkan total penjualan yang dilakukan oleh sebuah toko selama 15 hari berturut-turut:

 #create data frame
df <- data. frame (day=1:15,
                 sales=c(3, 6, 8, 10, 14, 17, 20, NA, NA, NA, NA, 35, 39, 44, 49))

#view data frame
df

   day sales
1 1 3
2 2 6
3 3 8
4 4 10
5 5 14
6 6 17
7 7 20
8 8 NA
9 9 NA
10 10 NA
11 11 NA
12 12 35
13 13 39
14 14 44
15 15 49

Perhatikan bahwa kami kehilangan angka penjualan selama empat hari dalam kerangka data.

Jika kita membuat diagram garis sederhana untuk memvisualisasikan penjualan dari waktu ke waktu, tampilannya akan seperti ini:

 #create line chart to visualize sales
plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ') 

menginterpolasi nilai yang hilang di R

Untuk mengisi nilai yang hilang, kita dapat menggunakan fungsi na.approx() dari paket zoo serta fungsi mutate() dari paket dplyr :

 library (dplyr)
library (zoo)

#interpolate missing values in 'sales' column
df <- df %>%
        mutate(sales = na. approx (sales))

#view updated data frame
df

   day sales
1 1 3
2 2 6
3 3 8
4 4 10
5 5 14
6 6 17
7 7 20
8 8 23
9 9 26
10 10 29
11 11 32
12 12 35
13 13 39
14 14 44
15 15 49

Perhatikan bahwa setiap nilai yang hilang telah diganti.

Jika kita membuat diagram garis lain untuk memvisualisasikan bingkai data yang diperbarui, tampilannya akan seperti ini:

 #create line chart to visualize sales
plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ') 

Perhatikan bahwa nilai yang dipilih oleh fungsi na.approx() tampaknya cukup cocok dengan tren data.

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang cara menangani nilai yang hilang di R:

Cara mencari dan menghitung nilai yang hilang di R
Bagaimana cara memasukkan semua nilai yang hilang di R
Cara menggunakan fungsi is.na di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *