A: drop_na を使用して欠損値のある行を削除する方法


R のTidyrパッケージのDrop_na()関数を使用して、データ フレーム内の欠損値を持つ行を削除できます。

この機能を使用するには、次の 3 つの一般的な方法があります。

方法 1: 任意の列に欠損値がある行を削除する

 df %>% drop_na()

方法 2: 特定の列に欠損値がある行を削除する

 df %>% drop_na(col1)

方法 3: いくつかの特定の列の 1 つで欠損値のある行を削除する

 df %>% drop_na(c(col1, col2))

次の例は、次のデータ フレームでこれらの各メソッドを実際に使用する方法を示しています。

 #create data frame
df <- data. frame (points=c(10, NA, 15, 15, 14, 16),
                 assists=c(4, NA, 4, NA, 9, 3),
                 rebounds=c(NA, 5, 10, 7, 7, NA))

#view data frame
df

  points assists rebounds
1 10 4 NA
2 NA NA 5
3 15 4 10
4 15 NA 7
5 14 9 7
6 16 3 NA

例 1: 任意の列に欠損値がある行を削除する

次のコードは、 drop_na()を使用して、任意の列に欠損値を持つ行を削除する方法を示しています。

 library (tidyr)

#drop rows with missing values in any column
df %>% drop_na()

  points assists rebounds
1 15 4 10
2 14 9 7

残っている行は、どの列にも欠損値が含まれていない行だけです。

例 2: 特定の列に欠損値がある行を削除する

次のコードは、 drop_na()を使用してバウンス列の欠損値を持つ行を削除する方法を示しています。

 library (tidyr)

#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)

  points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7

残っている行は、バウンス列に欠損値がない行のみです。

例 3: いくつかの特定の列の 1 つに欠損値がある行を削除する

次のコードは、 drop_na()を使用して、ポイント列またはアシスト列に欠損値を持つ行を削除する方法を示しています。

 library (tidyr)

#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))

  points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA

残っている行は、ポイントまたはアシスト列に欠損値がない行のみです。

注:ここで、 drop_na()メソッドの完全なオンライン ドキュメントを見つけることができます。

追加リソース

次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。

Rで行番号を取得する方法
R でデータ フレームに行を追加する方法
R のデータ フレームの各行に関数を適用する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です