Pandas dataframe の欠損値を数える方法
パンダ データフレーム内の欠損値の数を数えたい場合があります。
このチュートリアルでは、次の DataFrame を使用して欠損値をカウントする方法の例をいくつか示します。
import pandas as pd import numpy as np #create DataFrame with some missing values df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12], 'b': [np.nan, 6, 8, 14, 29, np.nan], 'c': [11, 8, 10, 6, 6, np.nan]}) #view DataFrame print (df) ABC 0 4.0 NaN 11.0 1 NaN 6.0 8.0 2 NaN 8.0 10.0 3 7.0 14.0 6.0 4 8.0 29.0 6.0 5 12.0 NaN NaN
DataFrame全体の欠損値の合計を数える
次のコードは、DataFrame 全体の欠損値の合計数を計算する方法を示しています。
df. isnull (). sum (). sum () 5
これにより、欠損値が合計5 つあることがわかります。
列ごとの欠損値の合計を数える
次のコードは、DataFrame の各列の欠損値の合計数を計算する方法を示しています。
df. isnull (). sum () at 2 b 2 c 1
これは次のことを示しています。
- 列「a」には欠損値が2 つあります。
- 列「b」には欠損値が2 つあります。
- 列「c」には欠損値が1 つあります。
欠損値の数を列全体に対する割合として表示することもできます。
df. isnull (). sum ()/ len (df)* 100 a 33.333333 b 33.333333 c 16.666667
これは次のことを示しています。
- 列「a」の値の33.33%が欠落しています。
- 列「b」の値の33.33%が欠落しています。
- 列「c」の値の16.67%が欠落しています。
行ごとの欠損値の合計を数える
次のコードは、DataFrame の各行の欠損値の合計数を計算する方法を示しています。
df. isnull (). sum (axis= 1 ) 0 1 1 1 2 1 30 4 0 5 2
これは次のことを示しています。
- 行 1 には欠損値が1 つあります。
- 行 2 には欠損値が1 つあります。
- 行 3 には欠損値が1 つあります。
- 行 4 には欠損値が0あります。
- 行 5 には欠損値が0あります。
- 行 6 には2 つの欠損値があります。