R で欠損値を見つけて数える方法 (例あり)


次のメソッドを使用して、R で欠損値を見つけてカウントできます。

方法 1: 欠損値の場所を見つける

 which( is.na (df$column_name))

方法 2: 欠損値の合計を数える

 sum( is.na (df$column_name))

次の例は、これらの関数を実際に使用する方法を示しています。

例 1: 列内の欠損値を検索してカウントする

次のデータ フレームがあるとします。

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

次のコードを使用して、「assist」列に欠損値がある位置を特定し、「assist」列の欠損値の合計を見つけることができます。

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

結果から、位置1、3 および4には「assists」列に欠損値があり、列には合計3 つの欠損値があることがわかります。

例 2: すべての列の欠損値を数える

次のコードは、データ フレームの各列の欠損値の合計をカウントする方法を示しています。

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

結果から次のことがわかります。

  • 「チーム」列には欠損値が1 つあります。
  • 「ポイント」列には欠損値が0 個含まれています。
  • 「支援」列には欠損値が3 つあります。
  • 「リバウンド」列には欠損値が1 つあります。

例 3: データ フレーム全体の欠損値を数える

次のコードは、データ フレーム全体の欠損値の合計をカウントする方法を示しています。

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

結果から、データ フレーム全体で合計5 つの欠損値があることがわかります。

追加リソース

次のチュートリアルでは、R で欠損値を使用して他の一般的な操作を実行する方法について説明します。

Rで欠損値をすべて代入する方法
R で NA を文字列に置き換える方法
dplyr で NA をゼロに置き換える方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です