如何计算 pandas dataframe 中的缺失值


通常,您可能想要计算 pandas DataFrame 中缺失值的数量。

本教程展示了如何使用以下 DataFrame 计算缺失值的几个示例:

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

统计整个DataFrame中总的缺失值

下面的代码展示了如何计算整个DataFrame中缺失值的总数:

 df. isnull (). sum (). sum ()

5

这告诉我们总共有5 个缺失值。

统计每列的总缺失值

下面的代码展示了如何计算DataFrame每列中缺失值的总数:

 df. isnull (). sum ()

at 2
b 2
c 1

这告诉我们:

  • “a”列有2 个缺失值。
  • “b”列有2 个缺失值。
  • “c”列有1 个缺失值。

您还可以将缺失值的数量显示为整列的百分比:

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

这告诉我们:

  • “a”列中有33.33%的值缺失。
  • “b”列中有33.33%的值缺失。
  • “c”列中有16.67%的值缺失。

统计每行的总缺失值

下面的代码展示了如何计算DataFrame每一行中缺失值的总数:

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

这告诉我们:

  • 第 1 行有1 个缺失值。
  • 第 2 行有1 个缺失值。
  • 第 3 行有1 个缺失值。
  • 第 4 行有0 个缺失值。
  • 第 5 行有0 个缺失值。
  • 第 6 行有2 个缺失值。

其他资源

如何在Pandas中查找多列中的唯一值
如何根据 Pandas 中的条件创建新列

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注