Pandalara eksik değerler nasıl atanır (bir örnek dahil)


Bir pandanın DataFrame’indeki eksik değerleri atamak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df[' column_name '] = df[' column_name ']. interpolate ()

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: Pandalarda Eksik Değerlerin Enterpolasyonu

Diyelim ki bir mağazanın art arda 15 gün boyunca yaptığı toplam satışları gösteren aşağıdaki pandalar DataFrame’e sahibiz:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
                   ' sales ': [3, 6, 8, 10, 14, 17, 20, np.nan, np.nan, np.nan,
                             np.nan, 35, 39, 44, 49]})

#view DataFrame
print (df)

    day sales
0 1 3.0
1 2 6.0
2 3 8.0
3 4 10.0
4 5 14.0
5 6 17.0
6 7 20.0
7 8 NaN
8 9 NaN
9 10 NaN
10 11 NaN
11 12 35.0
12 13 39.0
13 14 44.0
14 15 49.0

Veri çerçevesinde dört günlük satış rakamlarının eksik olduğunu unutmayın.

Zaman içindeki satışları görselleştirmek için basit bir çizgi grafik oluştursaydık şöyle görünürdü:

 #create line chart to visualize sales
df[' sales ']. plot ()

pandalara eksik değerleri yükleme

Eksik değerleri doldurmak için interpulate() fonksiyonunu aşağıdaki gibi kullanabiliriz:

 #interpolate missing values in 'sales' column
df[' sales '] = df[' sales ']. interpolate ()

#view DataFrame
print (df)

    day sales
0 1 3.0
1 2 6.0
2 3 8.0
3 4 10.0
4 5 14.0
5 6 17.0
6 7 20.0
7 8 23.0
8 9 26.0
9 10 29.0
10 11 32.0
11 12 35.0
12 13 39.0
13 14 44.0
14 15 49.0

Eksik değerlerin her birinin değiştirildiğini unutmayın.

Güncellenmiş veri çerçevesini görselleştirmek için başka bir çizgi grafik oluşturursak şöyle görünür:

 #create line chart to visualize sales
df[' sales ']. plot ()

interpulate() işlevi tarafından seçilen değerlerin, verilerin trendiyle oldukça iyi eşleştiğini unutmayın.

Not : interpulate() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.

Ek kaynaklar

Aşağıdaki eğitimler pandalarda eksik değerlerin nasıl ele alınacağı hakkında ek bilgi sağlar:

Pandalarda eksik değerler nasıl sayılır?
Pandas’ta NaN değerleri bir dizeyle nasıl değiştirilir?
Pandalarda NaN değerleri sıfırla nasıl değiştirilir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir