R の絶対中央偏差を計算する方法
絶対偏差の中央値は、データセット内の観測値の分布を測定します。
これは、標準偏差や分散などの他の分散の尺度よりも外れ値の影響が少ないため、特に便利な尺度です。
絶対中央値偏差 (MAD と略されることもあります) を計算する式は次のとおりです。
MAD = 中央値 (|x i – x m |)
金:
- x i :データセットのi 番目の値
- x m :データセット内の中央値
次の例は、組み込みのmad()関数を使用して R の絶対偏差の中央値を計算する方法を示しています。
例 1: ベクトルの MAD を計算する
次のコードは、R の単一ベクトルの中央絶対偏差を計算する方法を示しています。
#define data data <- c(1, 4, 4, 7, 12, 13, 16, 19, 22, 24) #calculate MAD mad(data) [1] 11.1195
データセットの絶対偏差の中央値は11.1195であることがわかります。
例 2: データ フレーム内の列の MAD を計算する
次のコードは、データ フレーム内の単一列の MAD を計算する方法を示しています。
#define data data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12), y = c(3, 4, 6, 8, 8, 9, 19), z = c(2, 2, 2, 3, 5, 8, 11)) #calculate MAD for column y in data frame mad(data$y) [1] 2.9652
列yの絶対中央偏差は2.9652であることがわかります。
例 3: データ フレーム内の複数の列の MAD を計算する
次のコードは、 sapply()関数を使用してデータ フレーム内の複数の列の MAD を計算する方法を示しています。
#define data
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
y = c(3, 4, 6, 8, 8, 9, 19),
z = c(2, 2, 2, 3, 5, 8, 11))
#calculate MAD for all columns in data frame
sapply(data, mad)
X Y Z
2.9652 2.9652 1.4826
絶対中央偏差は、列 x で2.9652 、列 y で2.9652 、列 z で1.4826です。
関連: R の apply()、lapply()、sapply()、tapply() のガイド