Cara menginterpolasi nilai yang hilang di r (termasuk contoh)
Anda dapat menggunakan sintaks dasar berikut untuk menginterpolasi nilai yang hilang dalam kolom bingkai data di R:
library (dplyr) library (zoo) df <- df %>% mutate(column_name = na. approx (column_name))
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Interpolasi Nilai yang Hilang di R
Misalkan kita memiliki kerangka data berikut di R yang menunjukkan total penjualan yang dilakukan oleh sebuah toko selama 15 hari berturut-turut:
#create data frame df <- data. frame (day=1:15, sales=c(3, 6, 8, 10, 14, 17, 20, NA, NA, NA, NA, 35, 39, 44, 49)) #view data frame df day sales 1 1 3 2 2 6 3 3 8 4 4 10 5 5 14 6 6 17 7 7 20 8 8 NA 9 9 NA 10 10 NA 11 11 NA 12 12 35 13 13 39 14 14 44 15 15 49
Perhatikan bahwa kami kehilangan angka penjualan selama empat hari dalam kerangka data.
Jika kita membuat diagram garis sederhana untuk memvisualisasikan penjualan dari waktu ke waktu, tampilannya akan seperti ini:
#create line chart to visualize sales plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ')
Untuk mengisi nilai yang hilang, kita dapat menggunakan fungsi na.approx() dari paket zoo serta fungsi mutate() dari paket dplyr :
library (dplyr) library (zoo) #interpolate missing values in 'sales' column df <- df %>% mutate(sales = na. approx (sales)) #view updated data frame df day sales 1 1 3 2 2 6 3 3 8 4 4 10 5 5 14 6 6 17 7 7 20 8 8 23 9 9 26 10 10 29 11 11 32 12 12 35 13 13 39 14 14 44 15 15 49
Perhatikan bahwa setiap nilai yang hilang telah diganti.
Jika kita membuat diagram garis lain untuk memvisualisasikan bingkai data yang diperbarui, tampilannya akan seperti ini:
#create line chart to visualize sales plot(df$sales, type=' o ', pch= 16 , col=' steelblue ', xlab=' Day ', ylab=' Sales ')
Perhatikan bahwa nilai yang dipilih oleh fungsi na.approx() tampaknya cukup cocok dengan tren data.
Sumber daya tambahan
Tutorial berikut memberikan informasi tambahan tentang cara menangani nilai yang hilang di R:
Cara mencari dan menghitung nilai yang hilang di R
Bagaimana cara memasukkan semua nilai yang hilang di R
Cara menggunakan fungsi is.na di R