Pandas dataframe の欠損値を数える方法


パンダ データフレーム内の欠損値の数を数えたい場合があります。

このチュートリアルでは、次の DataFrame を使用して欠損値をカウントする方法の例をいくつか示します。

 import pandas as pd
import numpy as np

#create DataFrame with some missing values
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view DataFrame
print (df)

      ABC
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN

DataFrame全体の欠損値の合計を数える

次のコードは、DataFrame 全体の欠損値の合計数を計算する方法を示しています。

 df. isnull (). sum (). sum ()

5

これにより、欠損値が合計5 つあることがわかります。

列ごとの欠損値の合計を数える

次のコードは、DataFrame の各列の欠損値の合計数を計算する方法を示しています。

 df. isnull (). sum ()

at 2
b 2
c 1

これは次のことを示しています。

  • 列「a」には欠損値が2 つあります。
  • 列「b」には欠損値が2 つあります。
  • 列「c」には欠損値が1 つあります。

欠損値の数を列全体に対する割合として表示することもできます。

 df. isnull (). sum ()/ len (df)* 100

a 33.333333
b 33.333333
c 16.666667

これは次のことを示しています。

  • 列「a」の値の33.33%が欠落しています。
  • 列「b」の値の33.33%が欠落しています。
  • 列「c」の値の16.67%が欠落しています。

行ごとの欠損値の合計を数える

次のコードは、DataFrame の各行の欠損値の合計数を計算する方法を示しています。

 df. isnull (). sum (axis= 1 )

0 1
1 1
2 1
30
4 0
5 2

これは次のことを示しています。

  • 行 1 には欠損値が1 つあります。
  • 行 2 には欠損値が1 つあります。
  • 行 3 には欠損値が1 つあります。
  • 行 4 には欠損値が0あります。
  • 行 5 には欠損値が0あります。
  • 行 6 には2 つの欠損値があります。

追加リソース

Pandas の複数の列の一意の値を見つける方法
Pandas で条件に基づいて新しい列を作成する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です