R でモードを計算する方法 (例付き)


データセットのモードは、最も頻度の高い値を表します。

特定のデータ セットでは、モードが存在しないか、単一モード、または複数のモードが存在する可能性があります。

R 統計ソフトウェアにはデータセットのモードを計算する組み込み関数はありませんが、次の関数を使用してモードを計算できます。

 find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

次の例は、この関数を実際に使用する方法を示しています。

例 1: デジタル ベクトルのモードの計算

次のコードは、この関数を使用してデジタル ベクトルのモードを計算する方法を示しています。

 #define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#define numeric vector
data <- c(1, 2, 2, 3, 4, 4, 4, 4, 5, 6)

#find fashion
find_mode(data)

[1] 4

データセットのモードは4であることがわかります。これは最も頻繁に現れる数字です。

データセットに複数のモードがある場合にもこの関数を使用できることに注意してください。

 #define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#define numeric vector with multiple modes
data <- c(1, 2, 2, 2, 2, 3, 4, 4, 4, 4, 5, 6)

#find fashion
find_mode(data)

[1] 2 4

データセットのモードは24です。これら 2 つの数値が最も一般的です。

例 2: 文字ベクトルのモードの計算

この関数は、文字ベクトルのモードを計算するためにも使用できます。

 #define function to calculate mode
find_mode <- function (x) {
  u <- unique(x)
  tab <- tabulate(match(x, u))
  u[tab == max(tab)]
}

#define character vector
data <- c('Sunny', 'Cloudy', 'Sunny', 'Sunny', 'Rainy', 'Cloudy')
#find fashion
find_mode(data)

[1] “Sunny”

モードは「Sunny」であることがわかります。これは、ベクトル内で最も頻繁に出現する文字列です。

追加リソース

次のチュートリアルでは、R で他の記述統計を計算する方法について説明します。

R で 5 つの数値の要約を計算する方法
Rで集計表を作成する方法
R で Mean() 関数を使用する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です