Como calcular o desvio mediano absoluto em r
O desvio absoluto mediano mede a distribuição das observações em um conjunto de dados.
Esta é uma medida particularmente útil porque é menos afetada por valores discrepantes do que outras medidas de dispersão, como desvio padrão e variância.
A fórmula para calcular o desvio mediano absoluto, muitas vezes abreviado como MAD, é:
MAD = mediana (|x i – x m |)
Ouro:
- x i : o i- ésimo valor do conjunto de dados
- x m : o valor mediano no conjunto de dados
Os exemplos a seguir mostram como calcular o desvio absoluto mediano em R usando a função mad() integrada.
Exemplo 1: calcule o MAD para um vetor
O código a seguir mostra como calcular o desvio absoluto mediano para um único vetor em R:
#define data data <- c(1, 4, 4, 7, 12, 13, 16, 19, 22, 24) #calculate MAD mad(data) [1] 11.1195
O desvio absoluto mediano para o conjunto de dados é 11,1195 .
Exemplo 2: Calcular MAD para uma coluna em um quadro de dados
O código a seguir mostra como calcular o MAD para uma única coluna em um quadro de dados:
#define data data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12), y = c(3, 4, 6, 8, 8, 9, 19), z = c(2, 2, 2, 3, 5, 8, 11)) #calculate MAD for column y in data frame mad(data$y) [1] 2.9652
O desvio mediano absoluto para a coluna y é 2,9652 .
Exemplo 3: Calcular MAD para múltiplas colunas em um quadro de dados
O código a seguir mostra como calcular MAD para múltiplas colunas em um quadro de dados usando a função sapply() :
#define data
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
y = c(3, 4, 6, 8, 8, 9, 19),
z = c(2, 2, 2, 3, 5, 8, 11))
#calculate MAD for all columns in data frame
sapply(data, mad)
X Y Z
2.9652 2.9652 1.4826
O desvio mediano absoluto é 2,9652 para a coluna x, 2,9652 para a coluna y e 1,4826 para a coluna z.
Relacionado: Um guia para apply(), lapply(), sapply() e tapply() em R
Recursos adicionais
Como calcular o MAPE em R
Como calcular MSE em R
Como calcular RMSE em R