Як заповнити значення na для кількох стовпців у pandas
Функція pandas fillna() корисна для заповнення відсутніх значень у стовпцях pandas DataFrame.
Цей підручник містить кілька прикладів використання цієї функції для заповнення відсутніх значень для кількох стовпців у таких pandas DataFrame:
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({'team': ['A', np. nan , 'B', 'B', 'B', 'C', 'C', 'C'], 'points': [25, np. no , 15, np. no , 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, np. no , 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 NaN NaN 7.0 8 2 B 15.0 7.0 10 3 B NaN 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 NaN 9 7 C 29.0 4.0 12
Приклад 1: Заповніть відсутні значення всіх стовпців
Наступний код показує, як заповнити відсутні значення нулями для всіх стовпців у DataFrame:
#replace all missing values with zero df. fillna (value= 0 ,inplace= True ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 0 0.0 7.0 8 2 B 15.0 7.0 10 3 B 0.0 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 0.0 9 7 C 29.0 4.0 12
Приклад 2: заповніть відсутні значення для кількох стовпців
Наступний код показує, як заповнити відсутні значення нулями лише для стовпців точки та допоміжних стовпців DataFrame:
#replace missing values in points and assists columns with zero df[['points', 'assists']] = df[['points', 'assists']]. fillna (value= 0 ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5.0 11 1 NaN 0.0 7.0 8 2 B 15.0 7.0 10 3 B 0.0 9.0 6 4 B 19.0 12.0 6 5 C 23.0 9.0 5 6 C 25.0 0.0 9 7 C 29.0 4.0 12
Приклад 3: заповніть відсутні значення з кількох стовпців різними значеннями
Наступний код показує, як заповнити відсутні значення в трьох різних стовпцях трьома різними значеннями:
#replace missing values in three columns with three different values df. fillna ({'team': ' Unknown ', 'points': 0 , 'assists': ' zero '}, inplace= True ) #view DataFrame print (df) team points assists rebounds 0 A 25.0 5 11 1 Unknown 0.0 7 8 2 B 15.0 7 10 3 B 0.0 9 6 4 B 19.0 12 6 5 C 23.0 9 5 6 C 25.0 zero 9 7 C 29.0 4 12
Зверніть увагу, що кожне з відсутніх значень у трьох стовпцях було замінено унікальним значенням.