Rで列内の固有の値を数える方法


次のメソッドを使用して、R のデータ フレームの列の一意の値の数をカウントできます。

方法 1: Base R を使用する

 length(unique(df$my_column))

方法 2: dplyr を使用する

 library (dplyr)

n_distinct(df$my_column)

次の例は、次のデータ フレームで各メソッドを実際に使用する方法を示しています。

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
                 points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))

#view data frame
df

  team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22

方法 1: R ベースを使用して列内の固有の値をカウントする

次のコードは、R 基本関数を使用してデータ フレームのポイント列の一意の値の数をカウントする方法を示しています。

 #count unique values in points column
length(unique(df$points))

[1] 7

ポイント列には 7 つの一意の値があります。

データ フレームの各列の一意の値の数をカウントするには、 sapply()関数を使用できます。

 #count unique values in each column
sapply(df, function (x) length(unique(x)))

  team points 
     4 7

結果から次のことがわかります。

  • ポイント列には 7 つの一意の値があります。
  • チーム列には 4 つの固有の値があります。

方法 2: dplyr を使用して列内の固有の値を数える

次のコードは、dplyr パッケージのn_distinct()関数を使用してポイント列内の個別の値の数をカウントする方法を示しています。

 library (dplyr)

#count unique values in points column
n_distinct(df$points)

[1] 7

ポイント列には 7 つの一意の値があります。

データ フレームの各列の一意の値の数をカウントするには、 sapply()関数を使用できます。

 library (dplyr)

#count unique values in each column
sapply(df, function (x) n_distinct(x))

  team points 
     4 7

結果から次のことがわかります。

  • ポイント列には 7 つの一意の値があります。
  • チーム列には 4 つの固有の値があります。

これらの結果は、基本的な R メソッドの結果と一致することに注意してください。

追加リソース

次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。

Rで重複を数える方法
Rでグループごとに一意の値をカウントする方法
Rの各列のNA値の数を数える方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です