Pandas: як заповнити значення nan за допомогою словника


Ви можете використовувати функцію fillna() зі словником, щоб замінити значення NaN в одному стовпці pandas DataFrame на основі значень в іншому стовпці.

Для цього ви можете використовувати такий базовий синтаксис:

 #define dictionary
dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 }

#replace values in col2 based on dictionary values in col1
df[' col2 '] = df[' col2 ']. fillna (df[' col1 ']. map (dict))

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: заповніть значення NaN у Pandas за допомогою словника

Скажімо, у нас є наступний DataFrame pandas, який містить інформацію про продажі в різних роздрібних магазинах:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'B', 'C', 'D', 'C', 'B', 'D'],
                   ' sales ': [12, np.nan, 30, np.nan, 24, np.nan, np.nan, 13]})

#view DataFrame
print (df)

  blind sales
0 to 12.0
1 A NaN
2 B 30.0
3 C NaN
4 D 24.0
5CNaN
6BNaN
7 D 13.0

Зверніть увагу, що в стовпці Продажі є кілька значень NaN.

Припустімо, ми хочемо заповнити ці NaN у стовпці продажів , використовуючи значення, які відповідають певним значенням у стовпці магазину .

Для цього ми можемо використати такий синтаксис:

 #define dictionary
dict = {' A ': 5 , ' B ': 10 , ' C ': 15 , ' D ': 20 }

#replace values in sales column based on dictionary values in store column
df[' sales '] = df[' sales ']. fillna (df[' store ']. map (dict))

#view updated DataFrame
print (df)

  blind sales
0 to 12.0
1 A 5.0
2 B 30.0
3C 15.0
4 D 24.0
5C 15.0
6 B 10.0
7 D 13.0

Ми використовували словник, щоб зробити такі заміни в стовпці продажів:

  • Якщо магазин — A , замініть NaN у Sales на значення 5 .
  • Якщо магазин — B , замініть NaN у продажу на значення 10 .
  • Якщо магазин — C , замініть NaN у продажу на значення 15 .
  • Якщо магазин — D , замініть NaN у продажу на значення 20 .

Ви можете знайти повну онлайн-документацію для функції fillna() тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:

Як порахувати пропущені значення в пандах
Як видалити рядки зі значеннями NaN в Pandas
Як видалити рядки, що містять певне значення в Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *