Pandalara eksik değerler nasıl atanır (bir örnek dahil)
Bir pandanın DataFrame’indeki eksik değerleri atamak için aşağıdaki temel sözdizimini kullanabilirsiniz:
df[' column_name '] = df[' column_name ']. interpolate ()
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: Pandalarda Eksik Değerlerin Enterpolasyonu
Diyelim ki bir mağazanın art arda 15 gün boyunca yaptığı toplam satışları gösteren aşağıdaki pandalar DataFrame’e sahibiz:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15], ' sales ': [3, 6, 8, 10, 14, 17, 20, np.nan, np.nan, np.nan, np.nan, 35, 39, 44, 49]}) #view DataFrame print (df) day sales 0 1 3.0 1 2 6.0 2 3 8.0 3 4 10.0 4 5 14.0 5 6 17.0 6 7 20.0 7 8 NaN 8 9 NaN 9 10 NaN 10 11 NaN 11 12 35.0 12 13 39.0 13 14 44.0 14 15 49.0
Veri çerçevesinde dört günlük satış rakamlarının eksik olduğunu unutmayın.
Zaman içindeki satışları görselleştirmek için basit bir çizgi grafik oluştursaydık şöyle görünürdü:
#create line chart to visualize sales df[' sales ']. plot ()
Eksik değerleri doldurmak için interpulate() fonksiyonunu aşağıdaki gibi kullanabiliriz:
#interpolate missing values in 'sales' column df[' sales '] = df[' sales ']. interpolate () #view DataFrame print (df) day sales 0 1 3.0 1 2 6.0 2 3 8.0 3 4 10.0 4 5 14.0 5 6 17.0 6 7 20.0 7 8 23.0 8 9 26.0 9 10 29.0 10 11 32.0 11 12 35.0 12 13 39.0 13 14 44.0 14 15 49.0
Eksik değerlerin her birinin değiştirildiğini unutmayın.
Güncellenmiş veri çerçevesini görselleştirmek için başka bir çizgi grafik oluşturursak şöyle görünür:
#create line chart to visualize sales df[' sales ']. plot ()
interpulate() işlevi tarafından seçilen değerlerin, verilerin trendiyle oldukça iyi eşleştiğini unutmayın.
Not : interpulate() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimler pandalarda eksik değerlerin nasıl ele alınacağı hakkında ek bilgi sağlar:
Pandalarda eksik değerler nasıl sayılır?
Pandas’ta NaN değerleri bir dizeyle nasıl değiştirilir?
Pandalarda NaN değerleri sıfırla nasıl değiştirilir?