Cara memperhitungkan nilai yang hilang di panda (termasuk contoh)


Anda dapat menggunakan sintaks dasar berikut untuk memperhitungkan nilai yang hilang dalam pandas DataFrame:

 df[' column_name '] = df[' column_name ']. interpolate ()

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Interpolasi Nilai yang Hilang di Pandas

Katakanlah kita memiliki panda DataFrame berikut yang menunjukkan total penjualan yang dilakukan oleh sebuah toko selama 15 hari berturut-turut:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
                   ' sales ': [3, 6, 8, 10, 14, 17, 20, np.nan, np.nan, np.nan,
                             np.nan, 35, 39, 44, 49]})

#view DataFrame
print (df)

    day sales
0 1 3.0
1 2 6.0
2 3 8.0
3 4 10.0
4 5 14.0
5 6 17.0
6 7 20.0
7 8 NaN
8 9 NaN
9 10 NaN
10 11 NaN
11 12 35.0
12 13 39.0
13 14 44.0
14 15 49.0

Perhatikan bahwa kami kehilangan angka penjualan selama empat hari dalam kerangka data.

Jika kita membuat diagram garis sederhana untuk memvisualisasikan penjualan dari waktu ke waktu, tampilannya akan seperti ini:

 #create line chart to visualize sales
df[' sales ']. plot ()

menyalahkan nilai yang hilang di panda

Untuk mengisi nilai yang hilang, kita dapat menggunakan fungsi interpolate() sebagai berikut:

 #interpolate missing values in 'sales' column
df[' sales '] = df[' sales ']. interpolate ()

#view DataFrame
print (df)

    day sales
0 1 3.0
1 2 6.0
2 3 8.0
3 4 10.0
4 5 14.0
5 6 17.0
6 7 20.0
7 8 23.0
8 9 26.0
9 10 29.0
10 11 32.0
11 12 35.0
12 13 39.0
13 14 44.0
14 15 49.0

Perhatikan bahwa setiap nilai yang hilang telah diganti.

Jika kita membuat diagram garis lain untuk memvisualisasikan bingkai data yang diperbarui, tampilannya akan seperti ini:

 #create line chart to visualize sales
df[' sales ']. plot ()

Perhatikan bahwa nilai yang dipilih oleh fungsi interpolate() tampaknya cukup cocok dengan tren data.

Catatan : Anda dapat menemukan dokumentasi lengkap untuk fungsi interpolate() di sini .

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang cara menangani nilai yang hilang di panda:

Cara menghitung nilai yang hilang di panda
Bagaimana cara mengganti nilai NaN dengan string di Pandas
Bagaimana cara mengganti nilai NaN dengan nol di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *