R에서 절대 중앙값 편차를 계산하는 방법
중앙값 절대 편차는 데이터 세트의 관측치 분포를 측정합니다.
이는 표준 편차 및 분산과 같은 다른 분산 측정값보다 이상치의 영향을 덜 받기 때문에 특히 유용한 측정값입니다.
절대 중앙값 편차(종종 MAD로 약칭)를 계산하는 공식은 다음과 같습니다.
MAD = 중앙값(|x i – x m |)
금:
- x i : 데이터세트의 i번째 값
- x m : 데이터 세트의 중앙값
다음 예에서는 내장된 mad() 함수를 사용하여 R의 중앙값 절대 편차를 계산하는 방법을 보여줍니다.
예 1: 벡터의 MAD 계산
다음 코드는 R의 단일 벡터에 대한 중앙값 절대 편차를 계산하는 방법을 보여줍니다.
#define data data <- c(1, 4, 4, 7, 12, 13, 16, 19, 22, 24) #calculate MAD mad(data) [1] 11.1195
데이터 세트의 절대 편차 중앙값은 11.1195 입니다.
예 2: 데이터 프레임의 열에 대한 MAD 계산
다음 코드는 데이터 프레임의 단일 열에 대해 MAD를 계산하는 방법을 보여줍니다.
#define data data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12), y = c(3, 4, 6, 8, 8, 9, 19), z = c(2, 2, 2, 3, 5, 8, 11)) #calculate MAD for column y in data frame mad(data$y) [1] 2.9652
y 열의 절대 중앙값 편차는 2.9652 입니다.
예 3: 데이터 프레임의 여러 열에 대한 MAD 계산
다음 코드는 sapply() 함수를 사용하여 데이터 프레임의 여러 열에 대한 MAD를 계산하는 방법을 보여줍니다.
#define data
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
y = c(3, 4, 6, 8, 8, 9, 19),
z = c(2, 2, 2, 3, 5, 8, 11))
#calculate MAD for all columns in data frame
sapply(data, mad)
X Y Z
2.9652 2.9652 1.4826
절대 중앙값 편차는 x 열의 경우 2.9652 , y 열의 경우 2.9652 , z 열의 경우 1.4826입니다 .
관련: R의 apply(), lapply(), sapply() 및 tapply()에 대한 가이드