Как подсчитать пропущенные значения в dataframe pandas


Часто вам может потребоваться подсчитать количество пропущенных значений в DataFrame pandas.

В этом руководстве показано несколько примеров того, как подсчитать пропущенные значения, используя следующий DataFrame:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

Подсчитайте общее количество пропущенных значений во всем DataFrame

Следующий код показывает, как вычислить общее количество пропущенных значений во всем DataFrame:

 df. isnull (). sum (). sum ()

5

Это говорит нам о том, что всего пропущено 5 значений.

Подсчитайте общее количество пропущенных значений в каждом столбце

Следующий код показывает, как вычислить общее количество пропущенных значений в каждом столбце DataFrame:

 df. isnull (). sum ()

at 2
b 2
c 1

Это говорит нам:

  • В столбце «а» пропущено 2 значения.
  • В столбце «b» пропущено 2 значения.
  • В столбце «c» пропущено 1 значение.

Также вы можете отобразить количество пропущенных значений в процентах от всего столбца:

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

Это говорит нам:

  • 33,33% значений в столбце «а» отсутствуют.
  • 33,33% значений в столбце «б» отсутствуют.
  • 16,67% значений в столбце «в» отсутствуют.

Подсчитайте общее количество пропущенных значений в каждой строке

Следующий код показывает, как вычислить общее количество пропущенных значений в каждой строке DataFrame:

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

Это говорит нам:

  • В строке 1 имеется 1 пропущенное значение.
  • В строке 2 имеется 1 пропущенное значение.
  • В строке 3 имеется 1 пропущенное значение.
  • В строке 4 нет пропущенных значений.
  • В строке 5 0 пропущенных значений.
  • В строке 6 пропущено 2 значения.

Дополнительные ресурсы

Как найти уникальные значения в нескольких столбцах в Pandas
Как создать новый столбец на основе условия в Pandas

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *