Pandalar: nan değerlerinin ortalama ile doldurulması (3 örnek)

İle Dr.benjamin anderson Temmuz 21, 2023 Rehber 0 Yorum

Bir pandanın DataFrame’indeki NaN değerlerini değiştirmek için fillna() işlevini kullanabilirsiniz.

Bu özelliği kullanmanın üç yaygın yolu şunlardır:

Yöntem 1: Bir sütundaki NaN değerlerini ortalamayla doldurun

 df[' col1 '] = df[' col1 ']. fillna (df[' col1 ']. mean ())

Yöntem 2: Birden fazla sütundaki NaN değerlerini ortalama ile doldurun

 df[[' col1 ', ' col2 ']] = df[[' col1 ', ' col2 ']]. fillna (df[[' col1 ',' col2 ']]. mean ())

Yöntem 3: Tüm sütunlardaki NaN değerlerini ortalama ile doldurun

 df = df. fillna ( df.mean ())

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import numpy as np
import pandas as pd

#create DataFrame with some NaN values
df = pd. DataFrame ({' rating ': [np.nan, 85, np.nan, 88, 94, 90, 76, 75, 87, 86],
                   ' points ': [25, np.nan, 14, 16, 27, 20, 12, 15, 14, 19],
                   ' assists ': [5, 7, 7, np.nan, 5, 7, 6, 9, 9, 5],
                   ' rebounds ': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame
df

        rating points assists rebounds
0 NaN 25.0 5.0 11
1 85.0 NaN 7.0 8
2 NaN 14.0 7.0 10
3 88.0 16.0 NaN 6
4 94.0 27.0 5.0 6
5 90.0 20.0 7.0 9
6 76.0 12.0 6.0 6
7 75.0 15.0 9.0 10
8 87.0 14.0 9.0 10
9 86.0 19.0 5.0 7

Örnek 1: Bir sütundaki NaN değerlerini ortalamayla doldurun

Aşağıdaki kod, derecelendirme sütunundaki NaN değerlerinin, derecelendirme sütununun ortalama değeriyle nasıl doldurulacağını gösterir:

 #fill NaNs with column mean in 'rating' column
df[' rating '] = df[' rating ']. fillna (df[' rating ']. mean ())

#view updated DataFrame
df

	rating points assists rebounds
0 85.125 25.0 5.0 11
1 85,000 NaN 7.0 8
2 85.125 14.0 7.0 10
3 88,000 16.0 NaN 6
4 94,000 27.0 5.0 6
5 90,000 20.0 7.0 9
6 76,000 12.0 6.0 6
7 75,000 15.0 9.0 10
8 87,000 14.0 9.0 10
9 86,000 19.0 5.0 7

Derecelendirme sütunundaki ortalama değer 85,125 idi, dolayısıyla derecelendirme sütunundaki NaN değerlerinin her biri bu değerle dolduruldu.

Örnek 2: Birden fazla sütundaki NaN değerlerini ortalamayla doldurun

Aşağıdaki kod, derecelendirme ve puan sütunlarındaki NaN değerlerinin ilgili sütun ortalamalarıyla nasıl doldurulacağını gösterir:

 #fill NaNs with column means in 'rating' and 'points' columns
df[[' rating ', ' points ']] = df[[' rating ', ' points ']]. fillna (df[[' rating ',' points ']]. mean ())

#view updated DataFrame
df

	rating points assists rebounds
0 85.125 25.0 5.0 11
1 85,000 18.0 7.0 8
2 85.125 14.0 7.0 10
3 88,000 16.0 NaN 6
4 94,000 27.0 5.0 6
5 90,000 20.0 7.0 9
6 76,000 12.0 6.0 6
7 75,000 15.0 9.0 10
8 87,000 14.0 9.0 10
9 86,000 19.0 5.0 7

Derece ve puan sütunlarındaki NaN değerleri, ilgili sütun ortalamalarıyla doldurulmuştur.

Örnek 3: Tüm sütunlardaki NaN değerlerini ortalama ile doldurun

Aşağıdaki kod, her sütundaki NaN değerlerinin sütun ortalamalarıyla nasıl doldurulacağını gösterir:

 #fill NaNs with column means in each column 
df = df. fillna ( df.mean ())

#view updated DataFrame
df

        rating points assists rebounds
0 85.125 25.0 5.000000 11
1 85,000 18.0 7,000000 8
2 85.125 14.0 7.000000 10
3 88,000 16.0 6.666667 6
4 94,000 27.0 5,000000 6
5 90,000 20.0 7,000000 9
6 76,000 12.0 6,000000 6
7 75,000 15.0 9,000000 10
8 87,000 14.0 9,000000 10
9 86,000 19.0 5,000000 7

Her sütundaki NaN değerlerinin kendi sütununun ortalamasıyla doldurulduğunu unutmayın.

fillna() işlevine ilişkin çevrimiçi belgelerin tamamını burada bulabilirsiniz.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalarda eksik değerler nasıl sayılır?
Pandalar’da NaN değerlerine sahip satırlar nasıl silinir
Pandalarda belirli bir değer içeren satırlar nasıl silinir

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil