如何计算 pandas dataframe 中的缺失值
通常,您可能想要计算 pandas DataFrame 中缺失值的数量。
本教程展示了如何使用以下 DataFrame 计算缺失值的几个示例:
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
统计整个DataFrame中总的缺失值
下面的代码展示了如何计算整个DataFrame中缺失值的总数:
df. isnull (). sum (). sum () 5
这告诉我们总共有5 个缺失值。
统计每列的总缺失值
下面的代码展示了如何计算DataFrame每列中缺失值的总数:
df. isnull (). sum () at 2 b 2 c 1
这告诉我们:
- “a”列有2 个缺失值。
- “b”列有2 个缺失值。
- “c”列有1 个缺失值。
您还可以将缺失值的数量显示为整列的百分比:
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
这告诉我们:
- “a”列中有33.33%的值缺失。
- “b”列中有33.33%的值缺失。
- “c”列中有16.67%的值缺失。
统计每行的总缺失值
下面的代码展示了如何计算DataFrame每一行中缺失值的总数:
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
这告诉我们:
- 第 1 行有1 个缺失值。
- 第 2 行有1 个缺失值。
- 第 3 行有1 个缺失值。
- 第 4 行有0 个缺失值。
- 第 5 行有0 个缺失值。
- 第 6 行有2 个缺失值。