Як підрахувати відсутні значення в pandas dataframe


Часто ви можете підрахувати кількість відсутніх значень у pandas DataFrame.

Цей підручник показує кілька прикладів того, як підрахувати відсутні значення за допомогою наступного DataFrame:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

Підрахуйте загальну кількість відсутніх значень у всьому DataFrame

Наступний код показує, як обчислити загальну кількість відсутніх значень у всьому DataFrame:

 df. isnull (). sum (). sum ()

5

Це говорить нам про те, що загалом бракує 5 значень.

Підрахуйте загальну кількість відсутніх значень у стовпці

Наступний код показує, як обчислити загальну кількість відсутніх значень у кожному стовпці DataFrame:

 df. isnull (). sum ()

at 2
b 2
c 1

Це говорить нам:

  • Стовпець «a» містить 2 відсутні значення.
  • Стовпець «b» містить 2 пропущених значення.
  • У стовпці «c» відсутнє 1 значення.

Ви також можете відобразити кількість відсутніх значень у відсотках від усього стовпця:

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

Це говорить нам:

  • 33,33% значень у графі «а» відсутні.
  • 33,33% значень у графі «б» відсутні.
  • 16,67% значень у стовпці «в» відсутні.

Підрахуйте загальну кількість пропущених значень у рядку

Наступний код показує, як обчислити загальну кількість відсутніх значень у кожному рядку DataFrame:

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

Це говорить нам:

  • У рядку 1 відсутнє 1 значення.
  • У рядку 2 відсутнє 1 значення.
  • У рядку 3 відсутнє 1 значення.
  • У рядку 4 відсутні 0 значень.
  • Рядок 5 містить 0 пропущених значень.
  • У рядку 6 відсутні 2 значення.

Додаткові ресурси

Як знайти унікальні значення в кількох стовпцях у Pandas
Як створити новий стовпець на основі умови в Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *