Як підрахувати відсутні значення в pandas dataframe
Часто ви можете підрахувати кількість відсутніх значень у pandas DataFrame.
Цей підручник показує кілька прикладів того, як підрахувати відсутні значення за допомогою наступного DataFrame:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
Підрахуйте загальну кількість відсутніх значень у всьому DataFrame
Наступний код показує, як обчислити загальну кількість відсутніх значень у всьому DataFrame:
df. isnull (). sum (). sum () 5
Це говорить нам про те, що загалом бракує 5 значень.
Підрахуйте загальну кількість відсутніх значень у стовпці
Наступний код показує, як обчислити загальну кількість відсутніх значень у кожному стовпці DataFrame:
df. isnull (). sum () at 2 b 2 c 1
Це говорить нам:
- Стовпець «a» містить 2 відсутні значення.
- Стовпець «b» містить 2 пропущених значення.
- У стовпці «c» відсутнє 1 значення.
Ви також можете відобразити кількість відсутніх значень у відсотках від усього стовпця:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
Це говорить нам:
- 33,33% значень у графі «а» відсутні.
- 33,33% значень у графі «б» відсутні.
- 16,67% значень у стовпці «в» відсутні.
Підрахуйте загальну кількість пропущених значень у рядку
Наступний код показує, як обчислити загальну кількість відсутніх значень у кожному рядку DataFrame:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
Це говорить нам:
- У рядку 1 відсутнє 1 значення.
- У рядку 2 відсутнє 1 значення.
- У рядку 3 відсутнє 1 значення.
- У рядку 4 відсутні 0 значень.
- Рядок 5 містить 0 пропущених значень.
- У рядку 6 відсутні 2 значення.
Додаткові ресурси
Як знайти унікальні значення в кількох стовпцях у Pandas
Як створити новий стовпець на основі умови в Pandas