Hoe de absolute mediaanafwijking in r te berekenen
De mediaan absolute afwijking meet de verdeling van waarnemingen in een dataset.
Dit is een bijzonder nuttige maatstaf omdat deze minder wordt beïnvloed door uitbijters dan andere spreidingsmaatstaven zoals standaarddeviatie en variantie.
De formule voor het berekenen van de absolute mediaanafwijking, vaak afgekort als MAD, is:
MAD = mediaan (|x i – x m |)
Goud:
- x i : de i- de waarde van de dataset
- x m : de mediaanwaarde in de gegevensset
De volgende voorbeelden laten zien hoe u de mediaan absolute afwijking in R kunt berekenen met behulp van de ingebouwde mad()- functie.
Voorbeeld 1: bereken de MAD voor een vector
De volgende code laat zien hoe u de mediaan absolute afwijking voor een enkele vector in R kunt berekenen:
#define data data <- c(1, 4, 4, 7, 12, 13, 16, 19, 22, 24) #calculate MAD mad(data) [1] 11.1195
De mediaan absolute afwijking voor de dataset blijkt 11,1195 te zijn.
Voorbeeld 2: Bereken MAD voor een kolom in een dataframe
De volgende code laat zien hoe u MAD berekent voor een enkele kolom in een dataframe:
#define data data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12), y = c(3, 4, 6, 8, 8, 9, 19), z = c(2, 2, 2, 3, 5, 8, 11)) #calculate MAD for column y in data frame mad(data$y) [1] 2.9652
De absolute mediaanafwijking voor kolom y blijkt 2,9652 te zijn.
Voorbeeld 3: Bereken MAD voor meerdere kolommen in een dataframe
De volgende code laat zien hoe u MAD voor meerdere kolommen in een dataframe berekent met behulp van de functie sapply() :
#define data
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
y = c(3, 4, 6, 8, 8, 9, 19),
z = c(2, 2, 2, 3, 5, 8, 11))
#calculate MAD for all columns in data frame
sapply(data, mad)
X Y Z
2.9652 2.9652 1.4826
De absolute mediaanafwijking is 2,9652 voor kolom x, 2,9652 voor kolom y en 1,4826 voor kolom z.
Gerelateerd: een handleiding voor apply(), lapply(), sapply() en tapply() in R
Aanvullende bronnen
Hoe MAPE in R te berekenen
Hoe MSE in R te berekenen
Hoe RMSE in R te berekenen